Artikel Tesis

(Rabu, 07 November 2007)

Penelitian ini bertujuan untuk mengungkapkan karakteristik butir soal Ujian Nasional Bahasa Indonesia SMA Program Studi IPA tahun pelajaran 2005/2006 serta untuk membuat pemetaan berkaitan dengan kualitas pendidikan antara kabupaten/kota di Propinsi Sulawesi Utara.

DJUNAIDI LABABA: Karakteristik Butir Soal Ujian Nasional Bahasa Indonesia SMA Program Studi IPA Tahun Pelajaran 2005/2006 di Propinsi Sulawesi Utara. Tesis. Yogyakarta: Program Pascasarjana, Universitas Negeri Yogyakarta, 2007.

Penelitian ini bertujuan untuk mengungkapkan karakteristik butir soal Ujian Nasional Bahasa Indonesia SMA Program Studi IPA tahun pelajaran 2005/2006 serta untuk membuat pemetaan berkaitan dengan kualitas pendidikan antara kabupaten/kota di Propinsi Sulawesi Utara.
Objek penelitian ini adalah Paket Tes 01 dan 03 Ujian Nasional Bahasa Indonesia SMA program studi IPA tahun pelajaran 2005/2006. Sumber data utama adalah 1.234 lembar jawaban siswa pada Paket 01 dan 2.842 lembar jawaban Paket 03. Data dianalisis dengan menggunakan pendekatan kualitatif dan kuantitatif. Pendekatan kualitatif dilakukan dengan menganalisis aspek materi, konstruksi dan bahasa. Pendekatan kuantitatif dilakukan dengan Teori Tes Klasik dan Teori Respon Butir 1 parameter (Rasch Model).
Hasil analisis kualitatif menunjukkan bahwa setiap butir yang terdapat pada Paket Tes 01 dan 03 berkualitas baik. Pada Paket 01 lima butir soal dan pada Paket 03 satu butir soal tidak memenuhi kriteria pada aspek konstruksi. Hasil analisis dengan Teori Tes Klasik menunjukkan bahwa kedua Paket Tes terkategori tidak baik. Sebanyak 20 butir (40%) pada Paket 01 dan 17 butir (34%) pada Paket 03 masuk kategori baik dari sisi tingkat kesukaran. Jumlah butir dengan daya beda yang baik untuk Paket 01 dan 03 berturut-turut sebanyak 16 dan 17 butir (32% dan 34%). Keefektifan distraktor untuk Paket 01 dan 03 berfungsi pada sebanyak 28 dan 35 butir (56% dan 70%). Hasil analisis berdasarkan teori respon butir menunjukkan sebanyak 40 butir (80%) Paket 01 dan 37 butir (74%) Paket Tes03 cocok dengan model. Sebanyak 30 butir (60%) Paket 01 dan 35 butir (70%) pada Paket 03 memiliki tingkat kesukaran sedang. Dengan demikian, berdasarkan teori respon butir 1 parameter Paket 01 masuk kategori cukup baik dan Paket 03 masuk kategori baik. Hasil pemetaan pendidikan berdasarkan Paket 01 menunjukkan bahwa daerah dengan kualitas pendidikan tertinggi adalah Kabupaten Minahasa Utara, diikuti Kabupaten Minahasa Selatan, Kabupaten Talaud, dan Kota Tomohon. Untuk Paket 03, daerah dengan kualitas pendidikan tertinggi adalah kota Manado. Selanjutnya diikuti oleh Kabupaten Minahasa, Kabupaten Bolaangmongondow, Kabupaten Sangihe dan Kota Bitung.

KATA KUNCI : Ujian Nasional, Teori Tes Klasik, Teori Respon Butir, Pemetaan Kualitas Pendidikan


A. Pendahuluan
Dalam sistem pendidikan di Indonesia, di setiap jenjang pendidikan dilaksanakan ujian akhir. Menurut Djemari Mardapi dkk. (2001: iii) hasil ujian dimanfaatkan sebagai salah satu syarat penentuan kelulusan, untuk menilai kompetensi yang dimiliki lulusan sesuai dengan yang telah ditetapkan, memotivasi guru dan siswa agar prestasi sekolah meningkat, menemukan konsep - konsep dari mata pelajaran yang belum dikuasai, menilai kinerja guru dan sekolah, sarana untuk seleksi ke jenjang yang lebih tinggi dan sebagai pertanggungjawaban (akuntabilitas) pihak sekolah atau madrasah kepada masyarakat sebagai stakeholder.
Untuk maksud tersebut, pelaksanaan ujian yang baik sangat tergantung pada ketersediaan alat ukur yang berkualitas. Sebuah alat ukur yang baik harus valid dan reliabel. Dalam pandangan Samuel Messick (1989: 13) validitas merupakan penilaian menyeluruh dimana bukti empiris dan logika teori mendukung pengambilan keputusan serta tindakan berdasarkan skor tes atau model-model penilaian yang lain. Validitas sebuah tes dapat dilakukan dalam berbagai bentuk seperti content validity, criterion validity dan construct-related validity. Meskipun idealnya validasi dapat dilakukan dengan memakai semua bentuk validitas tes tersebut, tetapi pengembang tes dapat memilih bentuk validasi dengan melihat tujuan pengembangan tes (Kumaidi, 1994: 58).
Selain valid, alat ukur yang baik juga harus reliabel. Dalam pandangan Aiken (1987: 42) sebuah tes dikatakan reliabel jika skor yang diperoleh oleh peserta relatif sama meskipun dilakukan pengukuran berulang-ulang. Untuk memperoleh skor yang sama, maka tidak boleh ada kesalahan pengukuran. Dengan demikian, keandalan sebuah alat ukur dapat dilihat dari dua petunjuk yaitu kesalahan baku pengukuran dan koefisien reliabilitas. Kedua statistik tersebut masing-masing memiliki kelebihan dan keterbatasan (Feldt & Brennan, 1989: 105).
Ujian Nasional (UN) merupakan salah satu kegiatan pengukuran dan penilaian kompetensi peserta didik secara nasional untuk jenjang pendidikan dasar dan menengah. Dalam Ujian Nasional tahun pelajaran 2005/2006 ada tiga mata pelajaran yang diujikan secara nasional yaitu Bahasa Indonesia, Bahasa Inggris dan Matematika. Adapun penyusunan soal dalam UN tahun 2005/2006 adalah berdasarkan standar kompetensi lulusan Kurikulum 1994 atau standar kompetensi lulusan “Kurikulum 2004”. “Kurikulum 2004” adalah kurikulum pendidikan dasar dan menengah yang sudah diterapkan secara terbatas mulai tahun pelajaran 2001/2002 berdasarkan Keputusan Direktur Jenderal Pendidikan Dasar dan Menengah No. 399a/C.C2/Kep/DS/2004 Tahun 2004, Keputusan Direktur Pendidikan Menengah Umum No. 766a/C4/MN/2003 Tahun 2003, dan No. 1247a/C4/MN/2003 Tahun 2003.
Karena sedemikian luasnya pengaruh yang ditimbulkan oleh hasil UN, maka perangkat tes yang digunakan memiliki posisi yang sangat vital. Kualitas perangkat tes yang baik akan menentukan ketepatan keputusan yang diambil oleh pengambil keputusan sehingga tidak ada pihak yang dirugikan. Tetapi jika perangkat tes yang digunakan tidak baik, maka hasil keputusan yang diambil dari hasil UN tersebut akan menimbulkan ketidakadilan. Karena itulah maka perangkat tes harus benar-benar berkualitas, baik secara kualitatif (teoretis) maupun kuantitatif (empiris).
Kualitas tes secara kualitatif dapat dilihat dari sisi materi, konstruksi dan bahasa. Aspek materi yang ditelaah berkaitan dengan substansi keilmuan yang ditanyakan dalam butir tes serta tingkat kemampuan yang sesuai dengan tes. Analisis konstruksi dimaksudkan untuk melihat hal-hal yang berkaitan dengan kaidah penulisan tes. Analisis bahasa dimaksudkan untuk menelaah tes berkaitan dengan penggunaan bahasa Indonesia yang baik dan benar menurut Ejaan Yang Disempurnakan (EYD). Adapun kualitas tes secara kuantitatif dapat ditinjau berdasarkan dua teknik yaitu dengan menggunakan teori tes klasik dan teori respon butir.
Dalam teori tes klasik, terdapat tiga parameter yang dapat digunakan dalam penentuan kualitas butir soal yaitu tingkat kesulitan, daya beda dan efektifitas distraktor.
Tingkat kesulitan butir sebagaimana dinyatakan oleh Allen & Yen (1979: 120) adalah proportion of examinees who get that item correct. Senada dengan mereka, Sax (1980: 193) menulis bahwa tingkat kesulitan adalah proporsi peserta ujian yang menjawab benar. Saifuddin Azwar (2003: 134) menyatakan dengan lebih lugas bahwa tingkat kesulitan butir adalah rasio penjawab butir dengan benar dan banyaknya penjawab butir. menurut Allen & Yen (1979: 121) tingkat kesulitan yang baik adalah 0,3 sampai 0,7. butir dengan tingkat kesulitan dibawah 0,3 dianggap butir soal yang sukar sedangkan jika indeksnya diatas 0,7, butir soal tersebut dianggap mudah.
Efektifitas distraktor adalah seberapa baik pilihan yang salah tersebut dapat mengecoh peserta tes yang memang tidak mengetahui kunci jawaban yang tersedia. Semakin banyak peserta tes yang memilih distraktor tersebut, maka distaktor itu dapat menjalankan fungsinya dengan baik. Menurut Depdikbud (1993: 27) sebuah distraktor dapat dikatakan berfungsi dengan baik jika dipilih oleh paling sedikit 5% untuk 4 pilihan jawaban dan 3% untuk 5 pilihan jawaban. Sedangkan menurut Fernandes (1984: 29) distraktor dikatakan baik jika dipilih oleh minimal 2% dari seluruh peserta. Distraktor yang tidak memenuhi kriteria tersebut sebaiknya diganti dengan distraktor lain yang mungkin lebih menarik minat peserta tes untuk memilihnya
Daya beda (diskriminasi) suatu butir tes adalah kemampuan suatu butir untuk membedakan antara peserta tes yang berkemampuan tinggi dan berkemampuan rendah. Ada empat macam teknik korelasi yang biasa digunakan untuk menghitung daya beda, yaitu : (1) teknik point biserial, (2) teknik biserial, (3) teknik phi, dan (4) teknik tetrachorik. Untuk menyatakan bahwa besaran daya beda dapat berfungsi dengan baik, ada beberapa patokan yang dapat digunakan. Menurut Djemari Mardapi (2005: 5) butir yang diterima harus memiliki indeks daya beda > 0,3. butir dengan indeks daya beda kurang dari antara 0,1 sampai 0,3 perlu direvisi dan jika daya bedanya < 0,1 maka butir tersebut tidak diterima. Ebel & Frisbie (1986: 234) memberikan patokan indeks daya beda yang baik harus lebih besar dari 0,3.
Menurut teori respon butir model Rasch, butir soal yang baik adalah butir soal yang memiliki kecocokan dengan model serta memiliki tingkat kesulitan yang sedang. Dengan menggunakan bantuan program BIGSTEP versi 2.30 butir yang cocok dengan model adalah butir yang memiliki nilai outfit < 2,0 atau memiliki nilai point biserial positif dengan tingkat kesulitan berkisar -0,2 sampai +0,2.
Meskipun telah melalui serangkaian analisis kualitatif dan kuantitatif, perangkat tes yang baik juga ditentukan ketepatan tingkat kesulitan dengan kemampuan peserta. Tes yang terlalu sulit atau terlalu mudah tidak akan memberikan informasi kemampuan sebenarnya yang dimiliki siswa. Perangkat tes yang sangat mudah, hanya membedakan antara orang bodoh dan bodoh sekali sedangkan perangkat tes yang terlalu sulit, maka daya pembedanya (discriminating power) hanya sensitif untuk mereka yang pandai dan pandai sekali (Jahja Umar, 2005: 57). Oleh karena itulah diperlukan telaah kembali butir soal setelah digunakan dilapangan untuk melihat sejauhmana kualitas butir soal tersebut.
Kondisi geografis Indonesia yang luas menyebabkan tidak meratanya kualitas pendidikan di setiap daerah. Hal ini berakibat pada perbedaan tingkat kemampuan siswa di tiap daerah. Dalam satu propinsi, kemampuan antara siswa yang ada di kota dengan di kabupaten juga memiliki perbedaan. Oleh karena itulah diperlukan peta yang terkait dengan kualitas pendidikan sehingga dapat dilihat bagaimana hasil dari proses pendidikan yang telah dilaksanakan oleh tiap kabupaten/kota.
Dengan mempertimbangkan keterbatasan waktu, dana, tenaga dan pertimbangan lainnya, penelitian ini peneliti hanya akan membatasi penelitian pada karakteristik butir-butir soal Bahasa Indonesia SMA paket 01dan 03 yang digunakan dalam Ujian Nasional tahun 2006 untuk Program Studi Ilmu Pengetahuan Alam (IPA) serta bagaimana peta kualitas pendidikan di setiap kota dan kabupaten di propinsi Sulawesi Utara berdasarkan kemampuan siswa dalam menjawab butir soal Ujian Nasional Bahasa Indonesia SMA program studi IPA.
B. Metode Penelitian
Penelitian bersifat ex-post facto karena peneliti tidak melakukan perlakuan apapun terhadap variabel penelitian. Data utama yang digunakan dalam penelitian ini adalah respon/jawaban siswa terhadap soal-soal yang terdapat dalam paket utama 01 dan paket utama 03 pada Ujian Nasional tahun 2006 mata pelajaran Bahasa Indonesia SMA program studi IPA/IPS. Penelitian ini terdiri dari dua kategori yaitu : (1) penelitian karakteristik butir berdasarkan teori tes klasik dan teori respon butir (2) pemetaan kualitas pendidikan berdasarkan perbedaan kemampuan siswa antara kota dan kabupaten.
Sumber data utama penelitian ini adalah respon siswa peserta ujian terhadap paket soal 01 dan 03 Ujian Nasional Bahasa Indonesia tahun pelajaran 2005/2006 di Propinsi Sulawesi Utara. Data respon siswa diperoleh dari Pusat Penilaian Pendidikan (PUSPENDIK) di Jakarta.
Data dianalisis dengan menggunakan dua pendekatan yaitu kualitatif dan kuantitatif. Analisis kualitatif dilakukan dengan menelaah aspek materi, konstruksi dan bahasa. Aspek materi yang ditelaah berkaitan dengan substansi keilmuan yang ditanyakan dalam butir tes serta tingkat kemampuan yang sesuai dengan tes. Analisis konstruksi dimaksudkan untuk melihat hal-hal yang berkaitan dengan kaidah penulisan tes. Analisis bahasa dimaksudkan untuk menelaah tes berkaitan dengan penggunaan bahasa Indonesia yang baik dan benar menurut Ejaan Yang Disempurnakan (EYD).
Analisis kuantitatif dilakukan dengan menggunakan teori tes klasik dan teori respon butir. Penggunaan teori tes klasik akan menggunakan bantuan program komputer ITEMAN versi 3.00 sedangkan teori respon butir menggunakan bantuan program komputer BIGSTEP versi 2.30.
Berdasarkan hasil analisis butir tes, maka kualitas setiap perangkat tes yang dianalisis ditentukan oleh persentasi jumlah butir tes yang tidak baik. Tinggi rendahnya kualitas perangkat tes ditentukan oleh banyak tidaknya butir tes yang baik. Dengan demikian, semakin banyak butir tes yang baik, maka semakin tinggi pula kualitas tes tersebut kriteria perangkat tes yang baik adalah jika persentase jumlah butir yang baik > 60%.
Pemetaan kualitas pendidikan pada dasarnya adalah untuk melihat bagaimana kualitas pendidikan di tiap kabupaten/kota yang ada di propinsi Sulawesi Utara. Dalam penelitian ini, kualitas pendidikan akan diukur melalui kemampuan siswa program Studi IPA dalam menjawab soal-soal Bahasa Indonesia yang terdapat pada Ujian Nasional SMA tahun akademik 2005/2006.

C. Hasil Penelitian dan Pembahasan
Berdasarkan analisis kualitatif pada paket 01, hanya terdapat 5 butir soal yang tidak memenuhi salah satu kriteria pada aspek konstruksi nomor 9 yaitu tentang panjang rumusan jawaban yang relatif sama untuk setiap pilihan jawaban serta 2 butir soal untuk aspek nomor 12 tentang kriteria pilihan jawaban butir tes tidak tergantung pada jawaban sebelumnya. Akan tetapi, tidak terpenuhinya kedua kriteria pada aspek konstruksi tidak menyebabkan butir soal menjadi tidak baik. Pada paket 03, hanya satu butir soal yang tidak memenuhi satu kriteria yang terdapat pada aspek konstruksi nomor 9 yaitu tentang panjangnya rumusan jawaban yang relatif sama. Dengan demikian, dari segi kualitatif paket tes 03 terkategori sangat baik.
Dengan kualitas yang baik dari kedua paket tes dari sisi kualitatif ternyata tidak serta merta menjadikan kedua paket tes tersebut juga baik dari sisi kuantitatif. Hasil telaah empiris terhadap kedua paket tes menemukan bahwa kedua paket tes tersebut justru terkategori tidak baik. Tidak baiknya kualitas dari sisi kuantitatif terjadi karena banyaknya butir soal yang berkualitas tidak baik
Analisis berdasarkan teori tes klasik memperlihatkan bahwa butir soal yang mudah atau sulit berjumlah 30 butir (60%) untuk paket tes 01 dan 33 butir (66%) untuk perangkat tes 03 sedangkan butir yang baik dari sisi tingkat kesukaran untuk paket 01 berjumlah 20 butir (40%) dan 17 (34%) butir untuk paket tes 03. Adapun daya beda Untuk paket 01 yang baik berjumlah 16 butir (32%) sedangkan paket 03 hanya 17 butir (34%) yang teridentifikasi memiliki daya beda yang baik. Dari sisi keberfungsian distraktor, paket 01 memiliki 22 butir (44%) yang memiliki distraktor yang tidak baik karena hanya dipilih kurang dari 2% peserta ujian sedangkan paket 03 memiliki 15 butir (30%) yang distraktornya tidak berfungsi dengan baik. Selain itu, paket 01 memiliki 8 buah butir yang ada peringatan “check the key” dan 3 buah butir (6%) untuk paket 03.
Dalam analisis dengan menggunakan teori respon butir 1 parameter (Rasch Model) ditemukan 80% butir pada paket 01 dan 74% butir pada paket 03 yang cocok dengan model. Dari butir-butir yang cocok tersebut dengan kedua perangkat tes tersebut, terlihat butir yang memiliki tingkat kesukaran sedang sebanyak 60% untuk paket 01 dan 70% untuk paket 03.
Salah satu hal yang menarik dari perbandingan hasil analisis kualitatif dan kuantitatif adalah banyaknya butir soal yang baik secara teoretis tetapi tidak baik jika dilihat dari segi empiris. Sebagian besar butir yang tidak baik disebabkan karena soal tersebut terlalu mudah bagi peserta serta ketidakcocokan soal dengan model Rasch.
Mudahnya butir soal dapat terjadi karena beberapa hal. Diantaranya adalah bahwa rumusan pertanyaan yang memang tidak sulit. Hal lain yang juga mungkin terjadi adalah adanya kecurangan dalam pelaksanaan tes misalnya terjadinya kerjasama antar peserta atau kebocoran kunci jawaban. Namun untuk membuktikan hal ini perlu dilakukan pengecekan langsung di lapangan tentang proses pelaksanaan Ujian Nasional. Hasil analisis konsistensi antara teori tes klasik dan teori respon butir dengan model Rasch memperlihatkan untuk paket tes 01 tingkat konsistensi sebesar 0,638 dan pada paket 03 sebesar 0,448.
Hasil penelitian juga memperlihatkan bahwa untuk kedua paket soal, butir tes yang termasuk kategori baik berdasarkan analisis teori klasik lebih sedikit dari butir yang hasil analisis dengan menggunakan teori respon butir 1 parameter. Dengan demikian, dibandingkan teori respon butir satu parameter, teori tes klasik lebih cenderung menolak butir. Hal dimungkinkan karena kriteria penerimaan butir teori tes klasik lebih banyak dari teori respon butir 1 parameter. Pada teori tes klasik, terdapat tiga kriteria sehingga butir dapat dikategorikan sebagai butir yang baik yaitu tingkat kesulitan, daya beda dan efektifitas distraktor sedangkan pada teori respon butir model Rasch hanya memiliki satu kriteria yaitu tingkat kesulitan.
Adapun, peta pendidikan di Propinsi Sulawesi Utara berdasarkan kemampuan siswa dalam menjawab soal-soal Bahasa Indonesia paket 01 dalam Ujian Nasional memperlihatkan bahwa terdapat perbedaan antara kabupaten/kota yang menggunakan paket soal tersebut. Berdasarkan hasil analisis terlihat bahwa daerah yang memiliki kualitas tertinggi adalah kabupaten Minahasa Utara disusul kabupaten Minahasa Selatan, kabupaten Kepulauan Talaud dan terakhir kota Tomohon. Adapun rata-rata kemampuan siswa yang menggunakan paket 01 sebesar 0,99. Pada paket tes 03 juga ditemukan adanya perbedaan kemampuan siswa diantara Kabupaten/Kota yang menggunakan paket tersebut. Hasil analisis memperlihatkan bahwa kota Manado adalah daerah dengan kualitas pendidikan tertinggi diantara daerah-daerah yang menggunakan paket tes 03. Selanjutnya disusul oleh kabupaten Minahasa, Kabupaten Bolaangmongondow, kabupaten Sangihe dan kota Bitung. Dengan rata-rata kemampuan siswa yang menggunakan paket 03 sebesar 1,53, maka satu-satunya daerah yang kemampuan siswanya berada di atas rata-rata kemampuan siswa secara keseluruhan adalah kota Manado, sedangkan kemampuan siswa di tiga kabupaten selain kabupaten Minahasa berada di bawah rata-rata
D. Kesimpulan
Dari hal-hal yang telah dipaparkan di atas, dapat ditarik beberapa benang merah berkaitan dengan karakteristik soal serta kualitas pendidikan di Kabupaten/kota di Propinsi Sulawesi Utara sebagai berikut : pertama Hasil analisis kualitatif terhadap paket tes 01 dan 03 Ujian Nasional SMA program studi IPA di propinsi Sulawesi Utara tahun akademik 2005/2006 menunjukkan kedua paket soal tersebut termasuk kategori baik. Hal ini ditunjukkan dengan terpenuhinya hampir semua kriteria dari aspek materi, konstruksi dan bahasa yang analisis. Kedua Hasil analisis empiris butir tes berdasarkan teori tes klasik menunjukkan bahwa kualitas paket tes 01 dan 03 termasuk kategori tidak baik. Butir tes pada paket 01 yang dikategorikan baik sebanyak 18 butir (36%) dan paket 03 sebanyak 13 butir (26%). Indeks keandalan untuk paket 01 sebesar 0,674 dan pada paket 03 sebesar 0,620 yang berarti masih di bawah batas minimal koefisien reliabilitas yang baik sebesar 0,7. Hasil analisis empiris butir tes berdasarkan teori respon butir (1 parameter) model Rasch menunjukkan bahwa kualitas paket tes 01 tergolong kurang baik dan 03 tergolong baik. Analisis akhir dengan menggunakan Bigstep menunjukkan bahwa butir paket 01 yang termasuk kategori baik berjumlah 30 butir (60%) dan paket 03 sebanyak 35 butir (70%).
Kedua terdapat perbedaan tingkat konsistensi antara paket tes 01 dan 03. Untuk paket tes 01, pengukuran dengan menggunakan teori tes klasik dan teori respon butir memiliki konsistensi yang tinggi sebesar 0,638 sedangkan pada paket tes 03, konsistensi antara pengukuran teori tes klasik dan teori respon butir masuk dalam kategori rendah yakni sebesar 0,448. Terjadinya perbedaan ini dikarenakan jumlah butir yang dikategorikan baik dan tidak baik tidak sama antara paket tes 01 dan 03.
Ketiga hasil pemetaan kualitas pendidikan berdasarkan kemampuan siswa dalam menjawab soal Bahasa Indonesia pada Ujian Nasional menunjukkan bahwa propinsi Sulawesi Utara tergolong baik. Meskipun demikian, jika ditinjau dari sudut pandang kota dan kabupten, masih terdapat perbedaan kualitas pendidikan antara kota dan kabupaten yang ada di propinsi Sulawesi Utara.



DAFTAR PUSTAKA

Aiken, L. R. (1987). Assessment of Intelectual functioning. Massachussetts: Allyn and Bacon Inc.
Allen, M. J., & Yen, W. M. (1979). Introduction to measurement theory. Monterey, California: Brookd/Cole Publishing Company.
Djemari Mardapi, dkk,. (2001). Sistem ujian akhir dalam otonomi daerah. Laporan penelitian. Yogyakarta: Universitas Negeri Yogyakarta.
________________. (2005). Pengembangan instrumen penelitian pendidikan. Yogyakarta: Program Pascasarjana Universitas Negeri Yogyakarta.
Ebel, R. L., & Frisbie, D. A. (1986) Essentials of measurement. New Jersey: Prentice Hall Inc.
Feldt, L. S., & Brennan, R. L. (1989) Reliability. Dalam Linn R. L. (Eds.), Educational Measurement Third Edition. (pp. 105-146). New York: McMillan.
Fernandes, H. J. X. (1984). Testing and measurement. Jakarta: National Education Planning, Evaluation and Development.
Jahja Umar. (2005). Tabel konversi yang menghebohkan. Dalam Eko (Eds.), UAN, Mengapa perlu?. Bekasi: Al-Kautsar Prima.
Kumaidi. (1994). Studi analitik terhadap karakteristik internal dari ujian seleksi masuk ke perguruan tinggi. Makalah disajikan dalam seminar pengkajian ujian saringan masuk ke perguruan tinggi di BALITBANG Depdiknas Jakarta.
Messick, S. (1989) Validity. Dalam Linn, R. L. (Eds.), Educational measurement third edition. (pp. 13-103). New York: McMillan.
Saifuddin Azwar. (2003). Tes prestasi : fungsi dan pengembangan pengukuran prestasi belajar. Yogyakarta: Pustaka Pelajar.

Posted in Label: Diposting oleh Penelitian dan Evaluasi Pendidikan di 15.06  

0 komentar:

 
Copyright 2005-2007. Hello Wiki designed by Fen, Arsip by Blog Tutorial.