Pendahuluan
Keberhasilan suatu proses pendidikan dan pelatihan dapat diketahui salah satunya dengan melakukan evaluasi atau tes hasil pendidikan dan pelatihan. Evaluasi hasil belajar peserta didik merupakan salah satu cara yang dapat dilakukan untuk mengetahui kemajuan peserta didik terhadap kurikulum yang telah diajarkan selama waktu tertentu. Meskipun evaluasi bukanlah satu-satunya cara untuk mengungkap hasil belajar peserta didik, tetapi ia merupakan alat yang paling sering digunakan karena kepraktisan penggunaannya serta biaya yang murah.Â
Sebagai alat untuk mengukur kemampuan peserta didik setelah mengikuti kegiatan pendidikan  dan pelatihan selama selang waktu tertentu, maka eksistensi evaluasi menjadi sangat penting. Sebuah evaluasi yang baik, akan bisa mengungkapkan keadaan sebenarnya dari peserta didik, dan tes yang tidak baik tidak akan bisa mengungkap apa kemampuan sebenarnya peserta didik. Pemberian soal yang terlalu susah atau terlalu mudah bisa menyebabkan sulitnya membedakan kemampuan peserta didik. Oleh karena itu, diperlukan analisis terhadap soal evaluasi dengan harapan hasil evaluasi merepresentasikan kemampuan peserta didik.
Untuk melihat kualitas sebuah tes dapat dilakukan dengan menggunakan analisis kualitatif (teoretik) dan kuantitatif (empiris). Secara kualitatif tes dikatakan baik jika telah memenuhi persyaratan penyusunan dari sisi materi, konstruksi dan bahasa. Adapun secara kuantiatif dapat dilakukan dengan dua teknik yaitu teori tes klasik (classical true-score theory) dan teori respon butir (Item Response Theory). Dalam tulisan ini penulis hanya akan memberikan pengantar tentang analisis secara kuantitatif untuk soal pilihan ganda.
Teori Tes Klasik
Analisis butir soal secara klasik adalah proses penelaahan butir soal melalui informasi dari jawaban peserta tes guna meningkatkan mutu butir soal yang bersangkutan dengan menggunakan teori tes klasik. Pada teori tes klasik, analisis item tes dilakukan dengan memperhitungkan kedudukan item dalam suatu kelas atau kelompok. Karakteristik atau kualitas item sangat tergantung pada kelompok dimana diujicobakan sehingga kualitas item terikat pada sampel responden atau peserta tes yang memberikan respons(sample bounded).
Ada beberapa kelebihan analisis butir soal secara klasik adalah murah, sederhana, familiar, dapat dilaksanakan sehari-hari dengan cepat menggunakan komputer dan dapat menggunakan beberapa data dari peserta tes.
Analisis butir soal secara modern adalah penelaahan butir soal dengan menggunakan teori respon butir atau item response theory. Teori ini merupakan suatu teori yang menggunakan fungsi matematika untuk menghubungkan antara peluang menjawab benar suatu butir dengan kemampuan peserta didik.
Teori ini muncul karena adanya beberapa keterbatasan pada analisis secara klasik, yaitu:
Tingkat kemampuan dalam teori klasik adalah true score.Artinya, jika suatu tes sulit maka tingkat kemampuan peserta tes akan rendah.sebaiknya, jika suatu tes mudah maka tingkat kemampuan peserta tes tinggi.
Tingkat kesukaran butir soal didefinisikan sebagai proporsi peserta tes yang menjawab benar. Mudah atau sulitnya butir soal tergantung pada kemampuan peserta tes.