Teori tes klasik memiliki alur dari pengembangan alat ukur dari konstrak hingga jawaban kemudian hingga kembali ke konstrak lagi. penjelasan prosesnya dari konstrak menjadi tes merupakan bagian dari diskusi mengenai operasionalisasi konstrak Kemudian dari tes untuk menjawab agar mendapatkan respon.Â
Kita belajar tentang konstruksi alat ukur Kemudian dari jawaban menjadi skor kita akan belajar tentang metode-metode penyekoran, Kemudian dari skor menjadi konstrak kita memerlukan proses inferensial yang berkaitan dengan teori atau model pengukuran Karena untuk menginterpretasikan skor dalam mempresentasikan sesuatu kita memerlukan teori-teori dalam proses ini.Â
Kemudian dari skor menjadi konstak yang pertama teori yang dipakai sebagai dasar pengembangan alat ukur, Hal ini dikarenakan teori menjelaskan suatu asumsi atau kondisi dimana kondisi ideal  mengenai pengukuran atau alat ukur. Teori juga dipakai sebagai dasar evaluasi alat ukur, Hal ini dimana kualitas alat ukur yang dikembangan di evaluasi berdasarkan teori tersebut. Teori pada pengukuran juga di bagi menjadi 2 yakni teori skor murni klasik (CTT) dan teori tes modern (IRT).Â
Teori skor murni klasik ini yakni dimana skor yang dilaporkan dari hasil pengadministrasian tes baik dari skor yang didapatkan dari sub tes dan skor dari keseluruhan tesnya skor yang demikian yang dinamakan dengan skor tampak. Skor tampak sendiri dihasilkan dari penjumlahan antara skor murni dan eror pengukuran. Eror disini bisa berupa penjumlahan dan pengurangan.Â
Dalam skor tampak ini adapun dekomposisinya dimana didalamnya mengandung suatu informasi mengenai skor murni dan eror pengukurannya. Skor tampak ( Observerd Score) ini terdiri dari skor murni (True score) dan eror pengukuran (Eror). Beberapa contoh bentuk skor tampak yakni ada skor mentah, skor terstandar, skor tes, skor sub tes dan skor persentil.Â
Skor murni dapat menunjukan atribut ukur yang ketepatan dan keakuratannya sempurna namun dapat diprediksi dan mengestimasi harga skor murni tersebut. Eror adalah sesuatu yang menyesatkan yang dapat menyebabkan informasi yang dihasilkan dari sesuatu menjadi tidak akurat.Â
Adapun eror dan incorrect dimana keduanya memiliki arti tentang suatu kesalahan, dalam bidang psikometrika namun makna eror berbeda dengan salah jawab atau incoorrect. Dimana eror disini merupakan kesalahan yang menyesatkan sehingga informasi yang benar menjadi memiliki rendah unsur kebenaranya sedangkan Incorrect yakni suatu kesalahan yang disebabkan oleh pengambilan keputusan yang diambil tidak sesuai dengan sesuatu yang dijadikan sebagai acuan.Â
Adapun asumsi terkait dengan teori tes klasik dimana pada bagian ini skor tampak merupakan nilai harapan yang didapatkan dari suatu pEngukuran. Nilai harapan ini biasanya didapatkan dari rerata skor tampak. Rerata dari eror pengukuran yakni merupakan sesuatu yang membuat skor tampak menjadi bias sehingga menjauhi skor murni. Asumsi selanjutnya yakni tidak ada hubungan eror dengan skor murni dimana prinsip ini menyatakan bahwa eror pengukura menimpa pada individu secara acak.Â
Dengan demikian pada asumsi ini skor individu dengan kemampuannya tinggi dan rendah sama-sama memiliki eror pengukuran yang bisa sama-sama besar. Pada asumsi berikutnya  besarnya eror pada satu tes tidak berhubungan dengan eror pada tes di waktu yang lain atau tes dengan bentuk yang lain. Hal ini memiliki pemahaman bahwa eror pengukuran menimpa pada individu pada pengukuran pertama, kedua dan selanjutnya tidak berkorelasi.Â
Asumsi selanutnya besarnya ror pada satu tes tidak berhubungan dengan skor murni pada tes di waktu yang lain atau tes dengan bentuk yang lain artinya eror prngukuran pada trial pertama tidak memilki kaitan dengan kemampuan individu pada pengukuran setelah pengukuran pertama. Eror sendiri tidak berkorelasi dengan apapun hal ini dikarenakan semua yang bersifat acak tidak memilki kaitan dengan apapun.Â
Beberapa implikasi praktik terkait teori tes klasik yakni untuk mendapatkan informasi skor murni diharapakan melakukan pengukuran secara berulang-ulang dan juga harus melakukan pengukuran dengan tes yang panjang atau banyak butir.Â
Teori respon butir adalah sebuah upaya untuk memadukan subjek dan butir dalam satu skala. Hasil pemaduan antara subjek dan butir dalam hal ini terbagi antara parameter yang bersifat invarian pada kelompok-kelompok di dalam populasi dan parameter abilitas bersifat invarian pada setiap butid di dalam tes.Â
Dalam analisis regresi linier terkait dengan persamaan regresi linier yakni ada intersep dimana intersep ini menunjukan nilai unit ketika b1 = 0 dan ada slope atau kemiringan dimana slope ini menunjukkan peranan x terhadap y, semakin besar semakin besar peranan tersebut, dan dalam psikometrika slope dapat merepresentasikan korelatsi butir total. Parameter kemiringan atau slope ini menunjukan semakin miring garis kemisringan semakin besar pengaruh variabel ditetapkan anteseden terhadap variabel keluaran.Â
Slope atau Kemiringan garis menunjukkan besarnya konstribusi butir itu dalam membedakan(mendiskriminasikan) kemampuan yang diukur, semakin miring semakin besar konstribusinya, dan jika kemiringan garisnya terbalik maka butir tersebut konstribusi terbalik. Model sendiri adalah suatu konsep yang dianggap sebagai sesuatu yang ideal dan sederhana yang dibuat untuk menilai atau menjelaskan fenomena empiris.Â
Berikut model dalam teori respons butir yakni model linier digunakan untuk meninjau data, maka kita akan melihat data dengan cara pandang yang sesuatu yang linier. Selain model linier ada juga model non linier dimana data ini digunakan untuk meninjau data,maka kita akan melihat data dengan cara pandang yang sesuatu yang linier. Beberapa jenis model yaitu meliputi model kaku, dan model luwes.Â
Model kaku sendiri adalah model yang cerewet, dan terlalu banyak hal yang harus dipenuhi sedangkan untuk model luwe adalah model yang tidak cerewet. Teori respon butir ini menggunakan model kurva logistic ogive dan model kurva normal ogive dan untuk kedua kurva tersebut bentuknya seoerti huruf "S". Persamaan yang digunakan oleh IRT terdiri dari dua komponen yaitu orang (sumbu x) dan butir (sumbu y). Probabilitas menjawab benar pada sebuah butir ditentukan oleh kemampuan orang dan parameter butir. Parameter butir sendiri yakni ada 3 jenis diantaranya yakni daya diskriminasi, tingkat kesulitan dan tebakan semu. Penerapan model dalam teori respon butir dalam IRT ini,baseline mencerminakan adanya sebuah peluang individu untuk melakukan tebakan. Parameter daya diskriminasi ditunjukan oleh suatu kemiringan garis.Â
Ada satu koefisien yang di dalam regresi yang dapat menunjukkan lokasi garis regresi. Adanya koefisien ini dapat menyebabkan lokasi garis regresi berpindah ke kanan maupun ke kiri, Dalam IRT lokasi menunjukkan parameter tingkat kesulitan butir. Model logistik 3 parameter (3PL) yakni daya beda,tingkat kesulitan, dan efek tebakan.Â
Dalam model logistik 2 parameter (2PL) yakni ada daya beda dan tingkat kesulitan, dimana daya beda butir bervariasi yang terlihat dari kemiringan yang berbeda-beda dan baseline mendekati 0. Model logistik 1 parameter (1PL) yaitu tingkat kesulitan. Beberapa model teori respon butir dalam teori pengukuran terbagi menjadi teori klasik dan teori modern (rasch,1PL, 2PL dan 3 PL.Â
Dalam model IRT 1 PL sederhana dan membutuhkan sebuah ukuran sampel yang tidak sebesar model 2PL atau 3PL, namun kurang dapat menunjukkan adanya butir yang problematik karena memiliki daya deskriminasi negatif. Dalam mdel 3 PL ini memberikan informasi yang lebih lengkap dibandingkan dengan model yang lain akan tetapi membutuhkan ukuran sampel yang sangat besar dan seringkali menghasilkan proses analisis yang lama.Â
Adapun eror standar pengukuran yakni ada prinsip lama dan prinsip baru, dalam prinsip lama ini kesalahan standar pengukuran berlaku untuk semua skor dalam populasi tertentu sedangkan prinsip baru ini kesalahan standar pengukuran berbeda di semua skor tetapi digeneralisasikan di seluruh populasi. Teori tes klasik menghasilkan informasi mengenai eror standar dimana satu untuk semua yang memiliki arti satu tes memiliki satu eror standar pengukuran.Â
Adapun perbedaan lainnya yakni dilihat dari segi panjang tes, dimana pada prinsip lama memiliki tes yang panjang akan menghasilkan skor yang reliabel dibandingkan dengan tes yang pendek sedangkan pada prinsip baru memiliki tes yang pendek bisa menghasilkan skor yang lebih reliabel dibandingkan dengan tes yang panjang.Â
Adapun perbandingan antar tes, pada prinsip lama memiliki perbandingan skor antar tes akan optimal jika tes yang dibandingkan itu paralel sedangkan pada prinsip baru memiliki perbandingan skor antar tes akan optimal jika tes yang dibandingkan itu tingkat kesulitannya yang bervariasi. Pada tes paralel ini memiliki rerata atau tingkat kesulitan sama, varians dan keberangaman sama, jumlah butir dan eror pengukuran.Â
Ada salah satu fasilitas dari IRT yang namanya tes information function (ITF) melalui TIF kita kan dapat mengembangkan tes-tes yang paralel. Dalam karakteristik sampel pada prinsip lama ini kualitas hasil pengukuran tergantung dari karakteristik sampel sedangkan karakteristik sampel pada prinsip baru ini kualitas pengukuran tidak bergantung dari karakteristik sampel.Â
Perbedaan lainnya yakni dilihat dari makna skor pada prinsip lama itu makna terhadap skor kemampuan individu didapatkan dari perbandingannya dengan orang-orang di dalam norma sedangkan pada prinsip baru itu makna terhadap skor kemampuan individu didapatkan dari selisihnya dari tingkat kesulitan butir. Data interval dimana pada prinsip lama ini data interval dapat dicapai dengan mendapatkan skor yang terditribusi normal sedangkan pada prinsip baru ini data interval bisa didapatkan dengan mengaplikasikan model pengukuran yang terjustifikasi.Â
Dalam pendekatan teori tes klasik, distribusi pada skor tes dapat dicapai melalui dua cara yakni komposisi tingkat kesulitan tes dipilih untuk butir-butir yang memiliki tigkat kesulitan sedang dan melakukan normalisasi data dengan cara melakukan transformasi skor menjadi normal. Pada skala dengan format berbeda ini pada prinsip lama memiliki butir-butir dengan format yang berbeda memberikan dampak berbeda-beda pada parameter butir sedangkan pada prinsip lama memiliki butir-butir dengan format yang bervariasi akan mampu menghasilkan tes yang optimal. Skor perubahan pada prinsip lama ini skor karena suatu perubahan (change score) tidak bisa dibandingkan dengan skor awalnya ketika skor inisialnya berbeda sedangkan pada prinsip baru ini skor akibat dari suatu perubahan dapat dibandingkan meskipun skor inisialnya berbeda.Â
Pada eror standar pengukuran pada prinsip lama memiliki analisis faktor pada butir yang bersifat biner (0;1) meghasilkan kumpulan butir berdasarkan artefak daripada faktor sedangkan pada prnsip baru memiliki analisis faktor pada semua jenis data mentah akan meghasilakan informasi mengenai faktor yang komprehensif. Eror standar pengukuran pada prinsip lama memiliki fitur-fitur stimulus pada sebuah butir adalah aspek yang tidak seberapa penting jika dikaitkan dengan properti psikometris sedangakan pada prinsip baru memiliki fitur-fitur stimulus pada sebuah butir dapat dikaitkan dengan proprti psikometris.
Baca konten-konten menarik Kompasiana langsung dari smartphone kamu. Follow channel WhatsApp Kompasiana sekarang di sini: https://whatsapp.com/channel/0029VaYjYaL4Spk7WflFYJ2H