Mohon tunggu...
Guntur Syarifuddin Putra
Guntur Syarifuddin Putra Mohon Tunggu... Pelajar Sekolah - Pelajar/Mahasiswa

saya adalah seorang mahasiswa dari UIN Walisongo Semarang, Saya memiliki semangat yang tinggi dalam menghadapi tantangan. Hobi saya adalah bermain bulu tangkis dan memancing

Selanjutnya

Tutup

Ilmu Alam & Tekno

Analisis Sentimen Dukungan Online Pro-Palestina Di Platform Reddit Menggunakan Metode Random Forest

14 Juni 2024   15:35 Diperbarui: 14 Juni 2024   15:48 359
+
Laporkan Konten
Laporkan Akun
Kompasiana adalah platform blog. Konten ini menjadi tanggung jawab bloger dan tidak mewakili pandangan redaksi Kompas.
Lihat foto
https://dltsierra.medium.com/algoritma-tf-idf-633e17d10a80

idf        : inverse document frequency tiap term/kata

- Random Forest

Random Forest adalah metode machine learning  yang terdiri dari gabungan Decision Tree  untuk dilakukan klasifikasi dimana untuk memperoleh keputusan akhir dilakukan voting mayority [14]. Random Forest adalah pengembangan dari metode Decision Tree yang menggunakan beberapa Decision Tree, dimana setiap Decision Tree telah dilakukan pelatihan menggunakan sampel individu dan setiap atribut dipecah pada pohon yang dipilih antara atribut subset yang bersifat acak, memiliki beberapa kelebihan, yaitu dapat meningkatkan hasil akurasi jika terdapat data yang hilang, dan untuk resesting outlers, serta efisien untuk penyimpanan ebuah data. Mmepunyai proses seleksi fitur dimana mampu megambil fitur terbaik sehingga dapat meningkatkan performa terhadap model klasifikasi [15].

- Evaluasi

Confusion matrix merupakan untuk menyajikan hasil akurasi dari model dan sumber informasi apakah model yang digunakan bekerja dengan baik atau sebaliknya. Confusion matrix digunakan untuk mengukur performa atau kinerja model dengan menghitung nilai akurasi terhadap accuracy, precision, recall, dan FI-score [1]. FI-score adalah perbandingan dari nilai recall dan juga nilai precision pada penelitian ini. Accuracy adalah tingkat keakuratan model dalam klasifikasi atau tingkat kedekatan prediksi dengan nilai sebenarnya. Precision adalah tingkat ketepatan pada prediksi true positive dalam keseluruhan data hasil prediksi positif. Recall adalah perbandingan ketepatan ratio prediksi true positife pada keseluruhan data true positif.

3. Hasil dan Pembahasan

Data yang diambil untuk analisis sentimen dukung online pro palestina di platform Reddit ini menggunakan teknik web scraping dari website Reddit didapatkan sebanyak 562 unggahan dari redditors yang berhasil memiliki engagement tinggi. Engagement sendiri adalah interaksi antara redditors yaitu meliputi like, komen, maupun klik pada unggahan. Berikut adalah hasil dari web scraping.

Tabel 1. Hasil web scraping

No

Headline

Label

1.

Protest shuts down Cleveland airport entrances

2.

This Rabbi wants the Immoral Dickheads Foundation to kill children and women

HALAMAN :
Mohon tunggu...

Lihat Konten Ilmu Alam & Tekno Selengkapnya
Lihat Ilmu Alam & Tekno Selengkapnya
Beri Komentar
Berkomentarlah secara bijaksana dan bertanggung jawab. Komentar sepenuhnya menjadi tanggung jawab komentator seperti diatur dalam UU ITE

Belum ada komentar. Jadilah yang pertama untuk memberikan komentar!
LAPORKAN KONTEN
Alasan
Laporkan Konten
Laporkan Akun