Penggunaan Algoritma CNN dalam Melakukan Klasifikasi Berita Hoax Halaman all

Di zaman yang berkembang ini, kegiatan tukar menukar informasi sering terjadi apalagi pada platform sosial media ,kita dapat melihat cuitan atau postingan yang diupload pada setiap akun yang terdapat didalmanya. Namun apakah Informasi yang terdapat pada akun tersebut dapat dipercaya atau mengandung hoax itu sangat susah dibedakan dan tak jarang banyak orang jatuh dalam berita hoax karena kurangnya pengetahuan untuk membedakan berita fakta ataupun hoax .

Deep learning menggunakan metode CNN merupakan metode yang biasanya digunakan untuk pengenalan pola spasial dan pengolahan citra , akan tetapi dapat digunakan juga dalam klasifikasi berita hoax yang dimana sangat membantu apalagi menjelang musim pemilu 2024 yang akan diadakan 1 Bulan lagi.

Cara kerja metode ini kurang lebih sebagai berikut:

1. Pengumpulan Dataset

Dalam pengujian ini dilakukan pengumpulan dataset ,yang dimana data yang ada diambil dari Kaggle yang berisi berita Hoax dan Fakta. Sumber : Fake-news-dataset-kaggle

2. Melakukan input terhadap dataset dan membagi teks menjadi label

Dalam tahap ini dilakukan pengujian yang dimana inputan dataset akan diubah menjadi label, lalu akan dibagi menajdi angka 1 dan 0 , 1 untuk berita fakta dan 0 untuk berita hoax

3. Stemming dan Lemmatization

sumber gambar pribadi

Stemming dan Lemmatization dilakukan untuk mengurangi kata-kata ke bentuk dasar, dengan mengurangi variasi kata system dapat mengenali pola dan makna.

4. Transformasi data latih dan data uji

sumber gambar pribadi

Data diubah dari format teks ke format numerik dengan menggunakan CountVectorizer. Matriks yang dihasilkan digunakan sebagai input untuk melatih dan menguji model pembelajaran mesin, di mana setiap barisnya sesuai dengan suatu dokumen, dan setiap kolomnya sesuai dengan suatu kata atau kombinasi kata.

5. Pembuatan Model CNN

sumber gambar pribadi

Pembuatan Convolutional Neural Network (CNN) dengan beberapa lapisan, termasuk lapisan embedding, lapisan konvolusi, dan lapisan dense.

6. Kompiler model

sumber gambar pribadi

Model dikompilasi dengan menggunakan :

optimizer 'adam' : bertujuan untuk mengoptimalkan parameter model sehingga model dapat belajar dari data dengan lebih efisien.
fungsi kerugian 'binary_crossentropy' : digunakan untuk mengukur seberapa baik model memprediksi output dibandingkan dengan nilai sebenarnya. binary_crossentropy' digunakan dalam tugas klasifikasi biner. Ini adalah fungsi kerugian umum untuk tugas tersebut.
Metric = ['accuracy'] : Metrics digunakan untuk mengevaluasi performa model selama pelatihan dan pengujian. 'accuracy' adalah metrik yang umum digunakan untuk tugas klasifikasi. Ini mengukur seberapa sering model memberikan prediksi yang benar.

7. Pengujian

sumber gambar pribadi

Data teks (cv_train_reviews) dan mencoba untuk memprediksi label yang sesuai (y_train) selama lima kali proses belajar. Tujuannya adalah agar model dapat mengenali pola dalam data dan menjadi lebih baik dalam memprediksi jawaban yang benar.

8. Prediksi dan Akurasi

sumber gambar pribadi

Di fase ini dilakukan prediksi dan akurasi, Hasil prediksi dari model dibandingkan dengan nilai batas tertentu, yaitu 0.9999. Prediksi yang lebih besar dari nilai ini akan dianggap sebagai True (benar), dan yang kurang dari atau sama dengan nilai ini akan dianggap sebagai False (salah).
Data nilai akurasi dari model pada data uji, yang memberikan gambaran seberapa baik model tersebut dapat memprediksi jawaban yang sebenarnya. Semakin tinggi nilai akurasi, semakin baik model tersebut dalam memprediksi data yang belum pernah dilihat sebelumnya.

9. Confusion Matrix

sumber gambar pribadi

Berikut diatas merupakan penjelasan mengenai algoritma CNN untuk klasifikasi berita hoax, untuk bentuk kode nya anda dapat mengujungi laman kaggle saya https://www.kaggle.com/code/rein0706/fake-news-detection-using-cnn.

Baca konten-konten menarik Kompasiana langsung dari smartphone kamu. Follow channel WhatsApp Kompasiana sekarang di sini: https://whatsapp.com/channel/0029VaYjYaL4Spk7WflFYJ2H

HALAMAN :

LIHAT SEMUA

Mohon tunggu...

Lihat Artificial intelligence Selengkapnya

Beri Komentar

Belum ada komentar. Jadilah yang pertama untuk memberikan komentar!

Penggunaan Algoritma CNN dalam Melakukan Klasifikasi Berita Hoax

artificialintelligence

model

hoax

data

algoritma pemrograman

metode cnn

klasifikasi

new world

artificial intelligence

Artikel Lainnya

LAPORKAN KONTEN

Steroid dalam dunia Bodybuilding: Manfaat, Risiko, dan Etika

Romo yang Patut Diteladan dalam Memberdayakan Umat

Memaknai Kembali Peran Matematika dalam Kehidupan

Penggunaan Algoritma CNN dalam Melakukan Klasifikasi Berita Hoax

artificialintelligence

model

hoax

data

algoritma pemrograman

metode cnn

klasifikasi

new world

artificial intelligence

Artikel Lainnya

LAPORKAN KONTEN