Di zaman yang berkembang ini, kegiatan tukar menukar informasi sering terjadi apalagi pada platform sosial media ,kita dapat melihat cuitan atau postingan yang diupload pada setiap akun yang terdapat didalmanya. Namun apakah Informasi yang terdapat pada akun tersebut dapat dipercaya atau mengandung hoax itu sangat susah dibedakan dan tak jarang banyak orang jatuh dalam berita hoax karena kurangnya pengetahuan untuk membedakan berita fakta ataupun hoax .
Deep learning menggunakan metode CNN merupakan metode yang biasanya digunakan untuk pengenalan pola spasial dan pengolahan citra , akan tetapi dapat digunakan juga dalam klasifikasi berita hoax yang dimana sangat membantu apalagi menjelang musim pemilu 2024 yang akan diadakan 1 Bulan lagi.
Cara kerja metode ini kurang lebih sebagai berikut:
1. Pengumpulan Dataset
Dalam pengujian ini dilakukan pengumpulan dataset ,yang dimana data yang ada diambil dari Kaggle yang berisi berita Hoax dan Fakta. Sumber : https://www.kaggle.com/datasets/emineyetm/fake-news-detection-datasets)
2. Melakukan input terhadap dataset dan membagi teks menjadi label
Dalam tahap ini dilakukan pengujian yang dimana inputan dataset akan diubah menjadi label, lalu akan dibagi menajdi angka 1 dan 0 , 1 untuk berita fakta dan 0 untuk berita hoax
3. Stemming dan Lemmatization
Stemming dan Lemmatization dilakukan untuk mengurangi kata-kata ke bentuk dasar, dengan mengurangi variasi kata system dapat mengenali pola dan makna.
4. Transformasi data latih dan data uji
Data diubah dari format teks ke format numerik dengan menggunakan CountVectorizer. Matriks yang dihasilkan digunakan sebagai input untuk melatih dan menguji model pembelajaran mesin, di mana setiap barisnya sesuai dengan suatu dokumen, dan setiap kolomnya sesuai dengan suatu kata atau kombinasi kata.
5. Pembuatan Model CNN
Pembuatan Convolutional Neural Network (CNN) dengan beberapa lapisan, termasuk lapisan embedding, lapisan konvolusi, dan lapisan dense.
6. Kompiler model
- Model dikompilasi dengan menggunakan optimizer 'adam' : bertujuan untuk mengoptimalkan parameter model sehingga model dapat belajar dari data dengan lebih efisien.
- fungsi kerugian 'binary_crossentropy' : digunakan untuk mengukur seberapa baik model memprediksi output dibandingkan dengan nilai sebenarnya. 'binary_crossentropy' digunakan dalam tugas klasifikasi biner. Ini adalah fungsi kerugian umum untuk tugas tersebut.
- Metric = [‘accuracy’] : Metrics digunakan untuk mengevaluasi performa model selama pelatihan dan pengujian. 'accuracy' adalah metrik yang umum digunakan untuk tugas klasifikasi. Ini mengukur seberapa sering model memberikan prediksi yang benar.