sure recov
...
......
...
Setelah melakukan pre-processing dan labelling menghasilkan 372 unggahan yang berlabel netral, 152 unggahan berlabel negatif, dan 37 unggahan berlabel positif. Selanjutnya, TF-IDF atau pembobotan kata yang bertujuan untuk menemukan frequency kemunculan term/kata. Pada Gambar 4. adalah hasil proses TF-IDF.
Proses selanjutnya adalah klasifikasi random forest. Hasil dari mengklasifikasi metode random forest akan digunakan untuk mengukur kinerja model dari model yang sedang diuji. diperoleh nilai true positive sebesar 72, true negative sebesar 19 , false positive sebesar 18, dan false negative sebesar 9. Untuk hasil evaluasi dari model klasifikasi random forest yang akan menghasilkan confusion report dari perhitungan semua matriks yang diperlukan untuk evaluasi.
Hasil dari evaluasi metode random forest pada Gambar 6 diperoleh nilai accuracy sebesar 75% yang menggambarkan tingkat keakuratan model ketika diklasifikasi. Nilai precision sebesar 85%, sedangkan nilai recall sebesar 50% keberhasilan pada penelitian ini. Untuk fi-score yaitu rata-rata precision dan recall bernilai 54%.
Kesimpulan
Berdasarkan hasil dari penilitian ini, terdapat tiga kelas/label yaitu positif, netral, dan negatif yang memiliki akurasi lumayan tinggi yaitu 75% yang berarti nilai akurat model klasifikasi analisis sentimen dukung online pro palestina di platform Reddit Menggunakan Metode Random Forest cukup baik. Diketahui juga frekuensi dari unggahan redditors memiliki nilai negatif lebih tinggi dibandingkan dengan kelas lainnya. Hal ini menunjukkan unggahan redditors yang membahas dukungan untuk palestina menggunakan term yang berkonotasi negatif.
Daftar Pustaka
[1] Tasya Auliya Ulul Azmi, L. H. (2023). Application Random Forest Method for Sentiment Analysis in Jamsostek . Telematika: Jurnal Informatika dan Teknologi, 116-127.