Daya pembeda, reliabilitas, dan validitas tes tergantung pada kondisi peserta tes.
Teori uji klasik merupakan satu dari masalah yang disampaikan oleh ahli psikologi Belanda Charles Spearmen dengan konsep korelasi (Crocker & Algina, 1986 dalam Ari Anggraini, 2009). Beberapa aspek yang diperhatikan dalam uji teori klasik yaitu tingkat kesukaran butir, daya pembeda butir, penyebaran pilihan jawaban, dan reliabilitas skor tes (Safari, 2000 dalamAri Anggraini, 2009).
- Tingkat Kesukaran Butir Soal (p)
Tingkat kesukaran soal adalah peluang untuk menjawab benar suatu soal pada tingkat kemampuan tertentu yang biasanya dinyatakan dalam bentuk indeks. Indeks tingkat kesukaran ini pada umumnya dinyatakan dalam bentuk proporsi yang besarnya berkisar 0,00 – 1,00. Perhitungan indeks tingkat kesukaran ini dilakukan untuk setiap nomor soal. Rumus di bawah ini dipergunakan untuk soal pilihan ganda (Nitko, 1996).
Semakin besar nilai p, yaitu semakin besar proporsi peserta tes dalam menjawab benar, maka soal tersebut dianggap mudah. Semakin kecil nilai p maka soal tersebut dianggap sukar.
Pada teori uji klasik, tingkat kesukaran butir soal bergantung kepada kemampuan peserta ujian. Bagi peserta ujian yang berkemampuan tinggi, butir soal menjadi mudah. Bagi peserta ujian yang berkemampuan rendah, butir soal menjadi sukar. Pada butir soal yang mudah, tampak kemampuan peserta ujian menjadi tinggi. Sedangkan pada butir soal yang sukar, maka kemampuan peserta ujian menjadi rendah. Oleh karena itu, tingkat kesukaran butir soal tidak sepenuhnya menggambarkan ukuran karakteristik butir soal sesungguhnya, akan tetapi lebih merupakan kemampuan rata-rata kelompok peserta ujian. Klasifikasi tingkat kesukaran soal dalam Nitko (1996) adalah:Â
-    Jika nilai p di antara 0,00 – 0,30 soal tergolong sukar;
-    Jika nilai p di antara 0,31 – 0,70 soal tergolong sedang;
-    Jika nilai p di antara nilai 0,71 – 1,00 soal tergolong mudah.
- Daya Pembeda (DP)
Daya Pembeda soal adalahkemampuan suatu butir soal untuk membedakan antara peserta tes yang berkemampuan tinggi dan berkemampuan rendah. Fungsi dari daya pembeda tersebut adalah mendeteksi perbedaan individual yang sekecil-kecilnya diantara para peserta tes. Daya pembeda soal dapat diketahui dengan melihat besar kecilnya indeks daya pembeda atau angka yang menunjukkan besar kecilnya daya pembeda. Indeks daya pembeda berkisar antara -1,00 sampai dengan 1,00. Semakin tinggi nilai daya pembeda soal, maka semakin baik soal tersebut.
Daya pembeda soal untuk bentuk pilihan ganda dapat dihitung dengan rumus sebagai berikut :
Keterangan :
  DP = daya pembeda soal,Â
  BA  = jumlah jawaban benar pada kelompok atas,
  BB  = jumlah jawaban benar pada kelompok bawah,