Optimasi Supervised Learning dengan Seleksi Fitur: Meningkatkan Klasifikasi Prestasi Belajar Mahasiswa di Era Pasca Pandemi
Pandemi COVID-19 telah mengubah banyak aspek kehidupan, termasuk sistem pendidikan global yang beralih secara drastis ke pembelajaran daring. Perguruan tinggi di berbagai negara termasuk Indonesia merespons pandemi ini dengan merancang strategi pendidikan yang meminimalisir interaksi langsung demi mencegah penyebaran virus. Salah satu tantangan utama dalam pembelajaran daring adalah dampaknya terhadap prestasi belajar mahasiswa. Banyak institusi menyuarakan kekhawatiran mereka tentang menurunnya kualitas hasil akademik akibat pembelajaran jarak jauh (Rahmadeyan & Mustakim, 2023). Di sisi lain, beberapa mahasiswa merasa nyaman dengan pembelajaran daring dan berhasil mempertahankan, bahkan meningkatkan prestasi mereka selama masa pandemi.
Seiring dengan kembalinya sistem pendidikan tatap muka pasca-pandemi, muncul pertanyaan tentang efektivitas metode pembelajaran tersebut dalam konteks yang lebih luas. Dalam konteks ini, penelitian mengenai klasifikasi prestasi belajar mahasiswa yang dilakukan oleh Rahmadeyan dan Mustakim (2023) menjadi relevan. Dengan menggunakan teknik supervised learning, penelitian ini berupaya memahami pola dan faktor yang memengaruhi prestasi akademik selama dan setelah pandemi. Mereka menggunakan algoritma seperti Nave Bayes Classifier (NBC), Classification and Regression Tree (CART), Random Forest (RF), dan Support Vector Machine (SVM) dengan seleksi fitur Chi-Square dan Mutual Information.
Temuan utama dari penelitian ini adalah bahwa penerapan seleksi fitur terbukti efektif dalam meningkatkan performa model klasifikasi. Salah satu contoh yang menonjol adalah model CART dengan seleksi fitur Chi-Square, yang mencapai akurasi 89%, naik 3% dibandingkan tanpa seleksi fitur, serta waktu komputasi yang jauh lebih cepat, yaitu hanya 0,01543 detik. Data ini menunjukkan pentingnya seleksi fitur dalam meningkatkan akurasi dan efisiensi algoritma klasifikasi pada data hasil belajar mahasiswa pasca pandemi (Rahmadeyan & Mustakim, 2023).
***
Dalam dunia supervised learning, salah satu tantangan terbesar adalah bagaimana memaksimalkan performa algoritma dengan data yang ada. Penelitian yang dilakukan oleh Rahmadeyan dan Mustakim (2023) menunjukkan bahwa seleksi fitur menjadi langkah krusial untuk meningkatkan efisiensi dan akurasi dalam klasifikasi prestasi belajar mahasiswa. Dari segi teknis, seleksi fitur bertujuan untuk mengeliminasi fitur-fitur yang tidak relevan atau kurang signifikan, sehingga model dapat bekerja lebih optimal dengan data yang lebih sederhana namun tetap akurat.
Dalam penelitian ini, mereka menggunakan dua metode seleksi fitur, yaitu Chi-Square dan Mutual Information. Chi-Square, metode statistik yang sering digunakan dalam uji signifikansi hubungan antar fitur, berhasil meningkatkan performa model CART. Dengan dua fitur yang dipilih melalui seleksi Chi-Square, model ini mencapai akurasi 89% dengan waktu komputasi 0,01543 detik. Sebagai perbandingan, ketika seleksi fitur tidak diterapkan, waktu komputasi meningkat menjadi 0,02172 detik dan akurasi turun menjadi 86%. Selain itu, Mutual Information, yang mengukur ketergantungan antar variabel, juga menunjukkan hasil serupa dalam meningkatkan akurasi meskipun sedikit lebih lambat dalam komputasi (Rahmadeyan & Mustakim, 2023).
Penelitian sebelumnya juga mendukung temuan ini. Misalnya, pada kasus klasifikasi penyakit jantung menggunakan algoritma CART, tingkat akurasi mencapai 87% ketika diterapkan seleksi fitur (Ozcan & Peker, 2023). Penerapan seleksi fitur terbukti meningkatkan efisiensi, terutama pada dataset yang besar dan kompleks, seperti pada studi prediksi penyakit hepatitis yang menghasilkan akurasi 92,41% menggunakan Random Forest dengan Mutual Information (Nayeem et al., 2021). Rahmadeyan dan Mustakim (2023) menunjukkan bahwa metode seleksi fitur ini efektif tidak hanya dalam konteks medis, tetapi juga pada data pendidikan.
Selain meningkatkan akurasi, seleksi fitur juga terbukti mampu mengurangi risiko overfitting. Dengan membuang fitur yang tidak relevan, model dapat fokus pada atribut yang memang berpengaruh signifikan terhadap variabel target. Dalam penelitian ini, tiga fitur utama yang ditemukan paling berpengaruh adalah pemahaman materi setelah pandemi, waktu belajar setelah pandemi, dan cara belajar mahasiswa. Dengan fokus pada fitur-fitur ini, perguruan tinggi dapat merancang strategi pembelajaran yang lebih tepat guna memaksimalkan prestasi akademik mahasiswa di era pasca-pandemi.
Dari segi implementasi praktis, hasil penelitian ini memberikan masukan penting bagi dunia pendidikan. Data yang dihasilkan menunjukkan bahwa metode supervised learning yang dipadukan dengan seleksi fitur dapat digunakan untuk memantau kemajuan akademik secara lebih efisien. Ini memungkinkan institusi pendidikan untuk mendeteksi tren dalam prestasi mahasiswa dan menyesuaikan metode pengajaran agar lebih responsif terhadap kebutuhan akademik yang berubah-ubah.
***