Mohon tunggu...
Theofilus Dewa
Theofilus Dewa Mohon Tunggu... Mahasiswa - Mahasiswa

Gamer, Music Enthusiast, Cybersecurity Analyst

Selanjutnya

Tutup

Artificial intelligence

Penggunaan Algoritma CNN dalam Melakukan Klasifikasi Berita Hoax

26 Januari 2024   02:37 Diperbarui: 26 Januari 2024   02:38 296
+
Laporkan Konten
Laporkan Akun
Kompasiana adalah platform blog. Konten ini menjadi tanggung jawab bloger dan tidak mewakili pandangan redaksi Kompas.
Lihat foto
Bagikan ide kreativitasmu dalam bentuk konten di Kompasiana | Sumber gambar: Freepik

Di zaman yang berkembang ini, kegiatan tukar menukar informasi sering terjadi apalagi pada platform sosial media ,kita dapat melihat cuitan atau postingan yang diupload pada setiap akun yang terdapat didalmanya. Namun apakah Informasi yang terdapat pada akun tersebut dapat dipercaya atau mengandung hoax itu sangat susah dibedakan dan tak jarang banyak orang jatuh dalam berita hoax karena kurangnya pengetahuan untuk membedakan berita fakta ataupun hoax .

Deep learning menggunakan metode CNN merupakan metode yang biasanya digunakan untuk pengenalan pola spasial dan pengolahan citra , akan tetapi dapat digunakan juga dalam klasifikasi berita hoax yang dimana sangat membantu apalagi menjelang musim pemilu 2024 yang akan diadakan 1 Bulan lagi.

Cara kerja metode ini kurang lebih sebagai berikut:

1. Pengumpulan Dataset

Dalam pengujian ini dilakukan pengumpulan dataset ,yang dimana data yang ada diambil dari Kaggle yang berisi berita Hoax dan Fakta. Sumber : Fake-news-dataset-kaggle

2. Melakukan input terhadap dataset dan membagi teks menjadi label

Dalam tahap ini dilakukan pengujian yang dimana inputan dataset akan diubah menjadi label, lalu akan dibagi menajdi angka 1 dan 0 , 1 untuk berita fakta dan 0 untuk berita hoax

3.  Stemming dan Lemmatization

sumber gambar pribadi
sumber gambar pribadi

Stemming dan Lemmatization dilakukan  untuk mengurangi kata-kata ke bentuk dasar, dengan mengurangi variasi kata system dapat mengenali pola dan makna.

4. Transformasi data latih dan data uji

sumber gambar pribadi
sumber gambar pribadi

Data diubah dari format teks ke format numerik dengan menggunakan CountVectorizer. Matriks yang dihasilkan digunakan sebagai input untuk melatih dan menguji model pembelajaran mesin, di mana setiap barisnya sesuai dengan suatu dokumen, dan setiap kolomnya sesuai dengan suatu kata atau kombinasi kata.

5. Pembuatan Model CNN

sumber gambar pribadi
sumber gambar pribadi

Pembuatan Convolutional Neural Network (CNN) dengan beberapa lapisan, termasuk lapisan embedding, lapisan konvolusi, dan lapisan dense.

6.  Kompiler model

sumber gambar pribadi
sumber gambar pribadi

Model dikompilasi dengan menggunakan :

  • optimizer 'adam' : bertujuan untuk mengoptimalkan parameter model sehingga model dapat belajar dari data dengan lebih efisien.
  • fungsi kerugian 'binary_crossentropy' : digunakan untuk mengukur seberapa baik model memprediksi output dibandingkan dengan nilai sebenarnya. binary_crossentropy' digunakan dalam tugas klasifikasi biner. Ini adalah fungsi kerugian umum untuk tugas tersebut.
  • Metric = ['accuracy'] : Metrics digunakan untuk mengevaluasi performa model selama pelatihan dan pengujian. 'accuracy' adalah metrik yang umum digunakan untuk tugas klasifikasi. Ini mengukur seberapa sering model memberikan prediksi yang benar.

7. Pengujian

sumber gambar pribadi
sumber gambar pribadi

Data teks (cv_train_reviews) dan mencoba untuk memprediksi label yang sesuai (y_train) selama lima kali proses belajar. Tujuannya adalah agar model dapat mengenali pola dalam data dan menjadi lebih baik dalam memprediksi jawaban yang benar.

8.  Prediksi dan Akurasi

 sumber gambar pribadi
 sumber gambar pribadi
  • Di fase ini dilakukan prediksi dan akurasi,  Hasil prediksi dari model dibandingkan dengan nilai batas tertentu, yaitu 0.9999. Prediksi yang lebih besar dari nilai ini akan dianggap sebagai True (benar), dan yang kurang dari atau sama dengan nilai ini akan dianggap sebagai False (salah).
  • Data nilai akurasi dari model pada data uji, yang memberikan gambaran seberapa baik model tersebut dapat memprediksi jawaban yang sebenarnya. Semakin tinggi nilai akurasi, semakin baik model tersebut dalam memprediksi data yang belum pernah dilihat sebelumnya.

9. Confusion Matrix

 sumber gambar pribadi
 sumber gambar pribadi

Berikut diatas merupakan penjelasan mengenai algoritma CNN untuk klasifikasi berita hoax, untuk bentuk kode nya anda dapat mengujungi laman kaggle saya  https://www.kaggle.com/code/rein0706/fake-news-detection-using-cnn.

Baca konten-konten menarik Kompasiana langsung dari smartphone kamu. Follow channel WhatsApp Kompasiana sekarang di sini: https://whatsapp.com/channel/0029VaYjYaL4Spk7WflFYJ2H

HALAMAN :
  1. 1
  2. 2
Mohon tunggu...

Lihat Konten Artificial intelligence Selengkapnya
Lihat Artificial intelligence Selengkapnya
Beri Komentar
Berkomentarlah secara bijaksana dan bertanggung jawab. Komentar sepenuhnya menjadi tanggung jawab komentator seperti diatur dalam UU ITE

Belum ada komentar. Jadilah yang pertama untuk memberikan komentar!
LAPORKAN KONTEN
Alasan
Laporkan Konten
Laporkan Akun