Cek hasil uji validitas & reliabilitasnya terakhir kapan? Dan lihat, apakah hasilnya bagus. Jangan lupa juga untuk lihat sampel yang digunakan, apakah jumlahnya besar (jadi bisa mewakili banyak orang) dan siapa yang menjadi sampelnya (usia kisaran berapa? di mana? dengan latar belakang seperti apa?).
DIADMINISTRASIKAN DENGAN BENAR
Suatu tes yang valid, reliabel, dan terkini, tetap tidak akan menjadi tes yang baik jika tidak diadministrasikan dengan baik. Misalnya, tes A mengukur IQ dan penelitian terakhir menunjukkan bahwa tes A valid, reliabel, dan terus diperbaharui secara berkala (terkini). Sayangnya, tes A diadministrasikan dan diskoring oleh orang yang tidak berwenang sehingga administrasinya salah (misalnya, harusnya tidak dibatasi waktu tapi malah dibatasi 30 detik per soal) atau skoring dan interpretasinya salah (misalnya, harusnya diberi skor 0,1,2 tapi hanya diberi skor benar/salah dan interpretasinya harusnya kategori rata-rata mampu melakukan A B C D namun dilaporkan hanya bisa melakukan A).
Bagaimana cara menentukan bahwa suatu tes diadministrasikan dengan benar?
Bagi awam, cara paling mudah adalah dengan memastikan ada psikolog yang bertanggung jawab atas tes dan hasil tes. Tes psikologi di Indonesia hanya boleh disahkan oleh psikolog. Soal, jawaban, lengkap beserta panduan hanya boleh dimiliki oleh psikolog yang memiliki izin praktik. Selain itu, psikolog juga familiar dengan hal-hal yang berkaitan dengan alat tes, publikasinya, serta pembaharuannya.
Secara lebih kompleks, kita bisa mengecek jenis tes yang digunakan, sejarahnya, perkembangannya, dan riwayat uji validitas dan reliabilitasnya. Sayangnya, ketika kita bukan psikolog kita tidak bisa memiliki akses untuk mengetahui panduan lengkapnya sehingga sebaik apapun kita mengecek kebaikan tes, kita tetap harus memastikan bahwa ada psikolog yang bisa dipercaya untuk bertanggung jawab atas tes dan hasilnya.
Dalam konteks penelitian psikologi
Alat ukur psikologi umumnya digunakan oleh psikolog dan ilmuwan psikologi (termasuk mahasiswa psikologi). Tentu saja, dengan batasan-batasan tertentu. Ada alat ukur yang penggunaannya sangat terbatas di mana hanya boleh digunakan oleh psikolog dan tidak diperkenankan untuk disahkan oleh ilmuwan psikologi.
Beberapa hal penting mengenai penggunaan alat ukur psikologi dalam penelitian psikologi:
- Prerequisite: statistika dan psikometrika; minimal sudah paham ukuran statistik, teori tes, dan teori respons item.
- Alat ukur psikologi umumnya digunakan sebagai instrumen penelitian psikologi dan alat untuk mengukur variabel psikologis. Yang termasuk variabel psikologis adalah segala sesuatu yang bersifat laten (tidak terlihat) yang terdapat di dalam diri manusia dan dapat diamati melalui perilaku tampak. Misalnya, variabel psikologisnya adalah kejenuhan (burnout) dan alat ukurnya adalah Skala Burnout yang berisi dimensi dan item yang mengukur burnout.
- Maximum performance & typical performance
Alat ukur psikologi secara umum mengukur dua hal; kemampuan kognitif dan kepribadian. Alat ukur yang mengukur kemampuan kognitif biasa disebut tes. Tes psikologi mengukur seberapa mampu seseorang dalam bidang tertentu (maximum performance). Sementara itu, alat ukur yang mengukur kepribadian seseorang biasa disebut skala. Skala psikologi mengukur seberapa cenderung seseorang memiliki trait atau sifat tertentu (typical performance). Karakteristik yang paling umum adalah tes psikologi memiliki acuan benar-salah dalam menilai jawaban tes, dan pada skala psikologi tidak ada benar-salah.
Contoh tes psikologi adalah tes kemampuan berbahasa, tes kemampuan matematika, tes bakat, dan lain-lain. Contoh skala psikologi adalah skala burnout, skala motivasi, skala perfeksionisme, skala untuk mengukur minat, dan lain-lain. - Tipe respons dalam alat ukur psikologi secara umum adalah agreement-disagreement, rank order, dan forced choice item. Agreement-disagreement sangat umum dalam skala psikologi. Contoh responsnya adalah pilihan Sangat Setuju, Setuju, Netral, Tidak Setuju, dan Sangat Tidak Setuju. Rank order berisi pilihan-pilihan di mana responden dapat memilih semua jawaban tetapi harus diurutkan dari yang paling sesuai atau dari yang paling setuju atau dari yang paling disukai. Forced choice item adalah tipe respons di mana responden harus memilih hanya dari pilihan yang tersedia dan biasanya pilihannya sangat dibatasi. Misalnya Ya atau Tidak.
- Konstruksi alat ukur (operasionalisasi variabel, penyusunan blueprint, pembuatan item) meliputi:
- Menentukan tujuan pengukuran.
- Menyusun kisi-kisi, mencakup operasionalisasi variabel dan menentukan spesifikasi tes.
- Penulisan item berdasarkan kisi-kisi.
- Analisis kualitatif (validasi konten).
- Revisi dan perakitan berdasarkan hasil analisis kualitatif.
- Uji coba instrumen ke responden dengan karakteristik yang sudah ditentukan.
- Analisis kuantitatif (validasi konstruk).
- Seleksi item, jika belum sesuai maka kembali dilakukan perakitan dan validasi sampai alat ukur valid.
- Alat ukur yang sudah terbukti valid dapat digunakan sesuai normanya. - Validasi alat ukur
Proses validasi alat ukur dilakukan untuk melihat apakah item dalam alat ukur mengukur konstruk yang dikehendaki atau tidak. Selain itu, dalam uji validitas juga kita dapat melihat seberapa baik alat ukur kita memenuhi tujuan pengukurannya. Uji validitas alat ukur terdiri dari uji validitas konten, uji validitas konstruk, dan uji validitas criterion-related.Validitas konten.
Validitas konten merupakan uji validitas yang melibatkan ahli (expert judgement) untuk menilai sintaksis, kesesuaian item dengan konteks, dan sebagainya. Proses ini dianalisis dengan pendekatan kualitatif. Para ahli diberikan alat ukur dan mereka menilai baik/tidak dan sesuai/tidaknya alat ukur tersebut. Penilaian dapat dilakukan secara bebas atau melalui form tertentu.Validitas konstruk.
Validitas konstruk merupakan uji validitas yang melibatkan responden dan uji statistik. Pendekatan klasik menggunakan analisis korelasi product moment untuk melihat validitas item, sementara pada pendekatan modern validitas diuji dengan metode yang lebih advanced seperti confirmatory factor analysis (CFA), Rasch analysis, dan Item Response Theory (IRT). Validitas konstruk merupakan uji validitas yang paling esensial dalam pengembangan skala psikologi, karena konstruk atau variabel psikologi biasanya dibangun berdasarkan teori yang tidak deterministik sehingga penting untuk diuji apakah benar teori tersebut dapat menjelaskan variabel tertentu.Validitas criterion related.
Validitas criterion-related berhubungan dengan apakah alat ukur tidak berbeda jauh dengan alat ukur sejenis (disebut juga concurrent validity) karena kalau ada dua alat ukur yang mengukur hal yang serupa maka seharusnya kedua alat ukur tersebut memiliki hubungan yang kuat. Selain itu, validitas criterion-related juga membahas mengenai apakah alat ukur mampu mencapai tujuan tertentu yang diprediksikan (disebut juga predictive validity), misalnya Tes Potensi Akademik dibuat alat ukurnya karena orang dengan skor TPA tinggi memiliki peluang sukses di perguruan tinggi lebih besar, maka predictive validity adalah alat yang kita gunakan untuk melihat apakah teori tersebut benar.