Di zaman yang berkembang ini, kegiatan tukar menukar informasi sering terjadi apalagi pada platform sosial media ,kita dapat melihat cuitan atau postingan yang diupload pada setiap akun yang terdapat didalmanya. Namun apakah Informasi yang terdapat pada akun tersebut dapat dipercaya atau mengandung hoax itu sangat susah dibedakan dan tak jarang banyak orang jatuh dalam berita hoax karena kurangnya pengetahuan untuk membedakan berita fakta ataupun hoax .
Deep learning menggunakan metode CNN merupakan metode yang biasanya digunakan untuk pengenalan pola spasial dan pengolahan citra , akan tetapi dapat digunakan juga dalam klasifikasi berita hoax yang dimana sangat membantu apalagi menjelang musim pemilu 2024 yang akan diadakan 1 Bulan lagi.
Cara kerja metode ini kurang lebih sebagai berikut:
1. Pengumpulan Dataset
Dalam pengujian ini dilakukan pengumpulan dataset ,yang dimana data yang ada diambil dari Kaggle yang berisi berita Hoax dan Fakta. Sumber : https://www.kaggle.com/datasets/emineyetm/fake-news-detection-datasets)
2. Melakukan input terhadap dataset dan membagi teks menjadi label
Dalam tahap ini dilakukan pengujian yang dimana inputan dataset akan diubah menjadi label, lalu akan dibagi menajdi angka 1 dan 0 , 1 untuk berita fakta dan 0 untuk berita hoax
3. Stemming dan Lemmatization
4. Transformasi data latih dan data uji
5. Pembuatan Model CNN
Pembuatan Convolutional Neural Network (CNN) dengan beberapa lapisan, termasuk lapisan embedding, lapisan konvolusi, dan lapisan dense.
6. Â Kompiler model
- Model dikompilasi dengan menggunakan optimizer 'adam' : bertujuan untuk mengoptimalkan parameter model sehingga model dapat belajar dari data dengan lebih efisien.
- fungsi kerugian 'binary_crossentropy' : digunakan untuk mengukur seberapa baik model memprediksi output dibandingkan dengan nilai sebenarnya. 'binary_crossentropy' digunakan dalam tugas klasifikasi biner. Ini adalah fungsi kerugian umum untuk tugas tersebut.
- Metric = [‘accuracy’] : Metrics digunakan untuk mengevaluasi performa model selama pelatihan dan pengujian. 'accuracy' adalah metrik yang umum digunakan untuk tugas klasifikasi. Ini mengukur seberapa sering model memberikan prediksi yang benar.
7. Â Pengujian
Data teks (cv_train_reviews) dan mencoba untuk memprediksi label yang sesuai (y_train) selama lima kali proses belajar. Tujuannya adalah agar model dapat mengenali pola dalam data dan menjadi lebih baik dalam memprediksi jawaban yang benar.
8. Prediksi dan AkurasiÂ
- Di fase ini dilakukan prediksi dan akurasi, Â Hasil prediksi dari model dibandingkan dengan nilai batas tertentu, yaitu 0.9999. Prediksi yang lebih besar dari nilai ini akan dianggap sebagai True (benar), dan yang kurang dari atau sama dengan nilai ini akan dianggap sebagai False (salah).
- Data nilai akurasi dari model pada data uji, yang memberikan gambaran seberapa baik model tersebut dapat memprediksi jawaban yang sebenarnya. Semakin tinggi nilai akurasi, semakin baik model tersebut dalam memprediksi data yang belum pernah dilihat sebelumnya
9. Confussion Matrix
Â
 Berikut diatas merupakan penjelasan terkait metode CNN yang digunakan untuk melakukan klasifikasi berita hoax, untuk bentuk kodenya anda dapat mengunjungi laman kaggle saya https://www.kaggle.com/code/rein0706/fake-news-detection-using-cnn.
Follow Instagram @kompasianacom juga Tiktok @kompasiana biar nggak ketinggalan event seru komunitas dan tips dapat cuan dari Kompasiana
Baca juga cerita inspiratif langsung dari smartphone kamu dengan bergabung di WhatsApp Channel Kompasiana di SINI