Apa itu Tes Psikologi?
Tes psikologi, atau skala psikologi, adalah alat ukur psikologis.
Perbedaannya, biasanya istilah tes digunakan untuk atribut** kognitif dan istilah skala digunakan untuk atribut kepribadian.
Alat ukur psikologis adalah instrumen yang digunakan dalam pengukuran psikologis. Pengukuran psikologis adalah proses kuantifikasi variabel laten* yang berupa atribut psikologis.
Intinya, tes psikologi adalah alat yang kita gunakan untuk mengetahui ukuran suatu aspek psikologis manusia.Â
Bagaimana cara menentukan apakah suatu tes psikologi bagus/baik?
Apa saja kriterianya? Apakah tes yang baik adalah tes yang dipublikasi oleh peneliti atau pengembang tes ternama? Atau apakah tes yang baik adalah tes yang digunakan oleh lembaga pengetesan psikologi yang terkenal? Atau apakah tes yang baik adalah tes yang diciptakan oleh negara adidaya?
Berikut jawabannya:
VALID
Valid artinya adalah tes mengukur yang seharusnya diukur. Misalnya, tes matematika ya harusnya mengukur kemampuan matematika, dan skala motivasi harusnya mengukur tingkat motivasi seseorang. Jangan sampai judulnya "skala motivasi" tapi yang diukur malah bukan motivasi.
Bagaimana caranya menentukan suatu tes valid?
Lihat hasil uji validitasnya. Biasanya dari publikasi ilmiah atau di panduan tes. Ada banyak metode dalam uji validitas, misalnya pada uji validitas konstruk ada teknik korelasi product moment, analisis faktor konfirmatorik (CFA), item response theory (IRT), dan sebagainya. Kriteria untuk menentukan tes valid dari berbagai metode ini juga beragam, tapi secara umum, tes yang valid adalah yang berkorelasi tinggi dengan variabel laten yang diukur.
Validitas dan reliabilitas berhubungan. Reliabilitas penting, namun validitas lebih penting. Suatu tes dapat tidak berfungsi dengan baik karena validitas itemnya rendah. Validitas yang tinggi membutuhkan reliabilitas yang juga tinggi.Â
Validitas dan reliabilitas merupakan dua kriteria utama dalam menilai alat ukur (Mohajan, 2017). Reliabilitas penting, namun tidak cukup untuk membuat suatu alat ukur dapat dikatakan valid (Miller et al., 2009). Suatu alat ukur tidak dapat berfungsi dengan baik ketika tidak lulus uji validitas (Anastasi, 1976). Untuk menjadi valid, alat ukur harus reliabel, namun alat ukur yang reliabel belum tentu valid (Kimberlin & Winterstein, 2008).
Istilah validitas pada alat ukur psikologi merujuk pada sejauh mana bukti dan teori dapat mendukung interpretasi skor yang dihasilkan untuk tujuan tertentu yang diniatkan pada alat ukur tertentu (American Educational Research Association et al., 2014). Pada proses validasi, pengembang tes atau pengguna tes mengumpulkan bukti untuk mendukung jenis kesimpulan yang akan diambil dari skor tes (Cronbach dalam Crocker & Algina, 2008). Untuk merencanakan uji validitas, inferensi yang diinginkan harus diidentifikasi dengan jelas, kemudian sebuah studi empiris dirancang untuk mendapatkan bukti tentang kegunaan skor berdasarkan relevansinya dengan tujuan pengukuran yang sudah ditetapkan di awal.
RELIABEL
Reliabel artinya handal. Misalnya, pada pengukuran fisik, kita mau mengukur berat badan, maka kita akan memilih timbangan yang bisa diandalkan. Kita tidak mau memilih timbangan yang ketika kita mengukur badan kita 5 kali sehari hasilnya 50, 80, 20, 15, 115. Setidak-tidaknya, dalam 5 kali menimbang hasilnya tidak berbeda jauh, misalnya 50, 51, 49, 50, 52. Artinya, kita mau timbangan tidak jauh menyimpang dari berat badan kita yang sebenar-benarnya. Sama halnya dengan pengukuran psikologi. Kita tidak mau menggunakan tes yang tidak handal. Misalnya, kita tidak mau menggunakan tes IQ yang hari ini mengkategorikan kita sebagai orang yang memiliki kecerdasan rata-rata lalu besok jenius lalu besoknya lagi retardasi.
Bagaimana cara menentukan bahwa suatu tes reliabel?
Validitas dan reliabilitas biasanya berkaitan. Ada banyak metode untuk melihat apakah suatu tes reliabel, bisa dengan menghitung koefisien Alpha, koefisien Omega, atau dengan menggunakan CFA dan IRT. Intinya, secara statistik, tes yang handal adalah tes dengan eror pengukuran yang kecil.
TERKINI
Tes yang baik adalah tes yang up to date. Hal ini tidak berarti kita hanya menggunakan tes yang baru diciptakan. Tes yang terlalu muda biasanya juga punya kelemahan; karena belum terlalu banyak diuji ulang. Tes yang terlalu tua biasanya punya lebih banyak kelemahan ketika tidak diperbaharui secara berkala. Semakin sering suatu tes diuji ulang dan hasilnya valid dan reliabel maka semakin baik tes tersebut.
Selain "baru", tes yang baik juga sebaiknya diuji pada sampel yang karakteristiknya mirip dengan peserta tes yang mau kita uji. Suatu tes yang valid di budaya A belum tentu valid di budaya B, jadi perlu diuji ulang.
Bagaimana cara menentukan bahwa suatu tes up to date?
Cek hasil uji validitas & reliabilitasnya terakhir kapan? Dan lihat, apakah hasilnya bagus. Jangan lupa juga untuk lihat sampel yang digunakan, apakah jumlahnya besar (jadi bisa mewakili banyak orang) dan siapa yang menjadi sampelnya (usia kisaran berapa? di mana? dengan latar belakang seperti apa?).
DIADMINISTRASIKAN DENGAN BENAR
Suatu tes yang valid, reliabel, dan terkini, tetap tidak akan menjadi tes yang baik jika tidak diadministrasikan dengan baik. Misalnya, tes A mengukur IQ dan penelitian terakhir menunjukkan bahwa tes A valid, reliabel, dan terus diperbaharui secara berkala (terkini). Sayangnya, tes A diadministrasikan dan diskoring oleh orang yang tidak berwenang sehingga administrasinya salah (misalnya, harusnya tidak dibatasi waktu tapi malah dibatasi 30 detik per soal) atau skoring dan interpretasinya salah (misalnya, harusnya diberi skor 0,1,2 tapi hanya diberi skor benar/salah dan interpretasinya harusnya kategori rata-rata mampu melakukan A B C D namun dilaporkan hanya bisa melakukan A).
Bagaimana cara menentukan bahwa suatu tes diadministrasikan dengan benar?
Bagi awam, cara paling mudah adalah dengan memastikan ada psikolog yang bertanggung jawab atas tes dan hasil tes. Tes psikologi di Indonesia hanya boleh disahkan oleh psikolog. Soal, jawaban, lengkap beserta panduan hanya boleh dimiliki oleh psikolog yang memiliki izin praktik. Selain itu, psikolog juga familiar dengan hal-hal yang berkaitan dengan alat tes, publikasinya, serta pembaharuannya.
Secara lebih kompleks, kita bisa mengecek jenis tes yang digunakan, sejarahnya, perkembangannya, dan riwayat uji validitas dan reliabilitasnya. Sayangnya, ketika kita bukan psikolog kita tidak bisa memiliki akses untuk mengetahui panduan lengkapnya sehingga sebaik apapun kita mengecek kebaikan tes, kita tetap harus memastikan bahwa ada psikolog yang bisa dipercaya untuk bertanggung jawab atas tes dan hasilnya.
Dalam konteks penelitian psikologi
Alat ukur psikologi umumnya digunakan oleh psikolog dan ilmuwan psikologi (termasuk mahasiswa psikologi). Tentu saja, dengan batasan-batasan tertentu. Ada alat ukur yang penggunaannya sangat terbatas di mana hanya boleh digunakan oleh psikolog dan tidak diperkenankan untuk disahkan oleh ilmuwan psikologi.
Beberapa hal penting mengenai penggunaan alat ukur psikologi dalam penelitian psikologi:
- Prerequisite: statistika dan psikometrika; minimal sudah paham ukuran statistik, teori tes, dan teori respons item.
- Alat ukur psikologi umumnya digunakan sebagai instrumen penelitian psikologi dan alat untuk mengukur variabel psikologis. Yang termasuk variabel psikologis adalah segala sesuatu yang bersifat laten (tidak terlihat) yang terdapat di dalam diri manusia dan dapat diamati melalui perilaku tampak. Misalnya, variabel psikologisnya adalah kejenuhan (burnout) dan alat ukurnya adalah Skala Burnout yang berisi dimensi dan item yang mengukur burnout.
- Maximum performance & typical performance
Alat ukur psikologi secara umum mengukur dua hal; kemampuan kognitif dan kepribadian. Alat ukur yang mengukur kemampuan kognitif biasa disebut tes. Tes psikologi mengukur seberapa mampu seseorang dalam bidang tertentu (maximum performance). Sementara itu, alat ukur yang mengukur kepribadian seseorang biasa disebut skala. Skala psikologi mengukur seberapa cenderung seseorang memiliki trait atau sifat tertentu (typical performance). Karakteristik yang paling umum adalah tes psikologi memiliki acuan benar-salah dalam menilai jawaban tes, dan pada skala psikologi tidak ada benar-salah.
Contoh tes psikologi adalah tes kemampuan berbahasa, tes kemampuan matematika, tes bakat, dan lain-lain. Contoh skala psikologi adalah skala burnout, skala motivasi, skala perfeksionisme, skala untuk mengukur minat, dan lain-lain. - Tipe respons dalam alat ukur psikologi secara umum adalah agreement-disagreement, rank order, dan forced choice item. Agreement-disagreement sangat umum dalam skala psikologi. Contoh responsnya adalah pilihan Sangat Setuju, Setuju, Netral, Tidak Setuju, dan Sangat Tidak Setuju. Rank order berisi pilihan-pilihan di mana responden dapat memilih semua jawaban tetapi harus diurutkan dari yang paling sesuai atau dari yang paling setuju atau dari yang paling disukai. Forced choice item adalah tipe respons di mana responden harus memilih hanya dari pilihan yang tersedia dan biasanya pilihannya sangat dibatasi. Misalnya Ya atau Tidak.
- Konstruksi alat ukur (operasionalisasi variabel, penyusunan blueprint, pembuatan item) meliputi:
- Menentukan tujuan pengukuran.
- Menyusun kisi-kisi, mencakup operasionalisasi variabel dan menentukan spesifikasi tes.
- Penulisan item berdasarkan kisi-kisi.
- Analisis kualitatif (validasi konten).
- Revisi dan perakitan berdasarkan hasil analisis kualitatif.
- Uji coba instrumen ke responden dengan karakteristik yang sudah ditentukan.
- Analisis kuantitatif (validasi konstruk).
- Seleksi item, jika belum sesuai maka kembali dilakukan perakitan dan validasi sampai alat ukur valid.
- Alat ukur yang sudah terbukti valid dapat digunakan sesuai normanya. - Validasi alat ukur
Proses validasi alat ukur dilakukan untuk melihat apakah item dalam alat ukur mengukur konstruk yang dikehendaki atau tidak. Selain itu, dalam uji validitas juga kita dapat melihat seberapa baik alat ukur kita memenuhi tujuan pengukurannya. Uji validitas alat ukur terdiri dari uji validitas konten, uji validitas konstruk, dan uji validitas criterion-related.Validitas konten.
Validitas konten merupakan uji validitas yang melibatkan ahli (expert judgement) untuk menilai sintaksis, kesesuaian item dengan konteks, dan sebagainya. Proses ini dianalisis dengan pendekatan kualitatif. Para ahli diberikan alat ukur dan mereka menilai baik/tidak dan sesuai/tidaknya alat ukur tersebut. Penilaian dapat dilakukan secara bebas atau melalui form tertentu.Validitas konstruk.
Validitas konstruk merupakan uji validitas yang melibatkan responden dan uji statistik. Pendekatan klasik menggunakan analisis korelasi product moment untuk melihat validitas item, sementara pada pendekatan modern validitas diuji dengan metode yang lebih advanced seperti confirmatory factor analysis (CFA), Rasch analysis, dan Item Response Theory (IRT). Validitas konstruk merupakan uji validitas yang paling esensial dalam pengembangan skala psikologi, karena konstruk atau variabel psikologi biasanya dibangun berdasarkan teori yang tidak deterministik sehingga penting untuk diuji apakah benar teori tersebut dapat menjelaskan variabel tertentu.Validitas criterion related.
Validitas criterion-related berhubungan dengan apakah alat ukur tidak berbeda jauh dengan alat ukur sejenis (disebut juga concurrent validity) karena kalau ada dua alat ukur yang mengukur hal yang serupa maka seharusnya kedua alat ukur tersebut memiliki hubungan yang kuat. Selain itu, validitas criterion-related juga membahas mengenai apakah alat ukur mampu mencapai tujuan tertentu yang diprediksikan (disebut juga predictive validity), misalnya Tes Potensi Akademik dibuat alat ukurnya karena orang dengan skor TPA tinggi memiliki peluang sukses di perguruan tinggi lebih besar, maka predictive validity adalah alat yang kita gunakan untuk melihat apakah teori tersebut benar.
Penutup
Kesimpulannya, alat ukur psikologis yang baik sangat penting untuk penelitian psikologi yang akurat dan bermakna. Alat tersebut harus dapat diandalkan dan valid, dan memenuhi kriteria tertentu untuk memastikan kegunaan dan kredibilitasnya. Kriteria ini termasuk standardisasi dan norma yang memadai, instruksi yang jelas dan tidak ambigu, batas waktu yang tepat, dan pertimbangan potensi bias dan kekacauan. Dengan memenuhi kriteria ini, alat ukur dapat secara efektif mengukur konstruk minat, dan memberikan informasi berharga untuk memahami perilaku manusia dan menginformasikan intervensi. Karena bidang psikologi terus maju, penting untuk tetap waspada dalam pemilihan dan penggunaan alat pengukuran kami, untuk memastikan kualitas penelitian tertinggi dan hasil terbaik bagi individu.
Keterangan:
*variabel laten: variabel yang tidak dapat diamati. volume tubuh seseorang dapat dibandingkan secara kasat mata, namun motivasi seseorang tidak dapat dibandingkan hanya dengan melihat fisiknya. Hal ini disebabkan karena motivasi bersifat laten (tidak terlihat), sehingga perlu diukur dengan hal-hal lain yang bisa diamati (perilaku, respons jawaban, dll.)
**atribut: fitur, aspek, variabel.
Baca konten-konten menarik Kompasiana langsung dari smartphone kamu. Follow channel WhatsApp Kompasiana sekarang di sini: https://whatsapp.com/channel/0029VaYjYaL4Spk7WflFYJ2H