Lihat ke Halaman Asli

Penggunaan Algoritma CNN dalam Melakukan Klasifikasi Berita Hoax

Diperbarui: 26 Januari 2024   07:01

Kompasiana adalah platform blog. Konten ini menjadi tanggung jawab bloger dan tidak mewakili pandangan redaksi Kompas.

Sumber Pribadi

Di zaman yang berkembang ini, kegiatan tukar menukar informasi sering terjadi apalagi pada platform sosial media ,kita dapat melihat cuitan atau postingan yang diupload pada setiap akun yang terdapat didalmanya. Namun apakah Informasi yang terdapat pada akun tersebut dapat dipercaya atau mengandung hoax itu sangat susah dibedakan dan tak jarang banyak orang jatuh dalam berita hoax karena kurangnya pengetahuan untuk membedakan berita fakta ataupun hoax .

Deep learning menggunakan metode CNN merupakan metode yang biasanya digunakan untuk pengenalan pola spasial dan pengolahan citra , akan tetapi dapat digunakan juga dalam klasifikasi berita hoax yang dimana sangat membantu apalagi menjelang musim pemilu 2024 yang akan diadakan 1 Bulan lagi.

Cara kerja metode ini kurang lebih sebagai berikut:

1. Pengumpulan Dataset

Dalam pengujian ini dilakukan pengumpulan dataset ,yang dimana data yang ada diambil dari Kaggle yang berisi berita Hoax dan Fakta. Sumber : https://www.kaggle.com/datasets/emineyetm/fake-news-detection-datasets)


2. Melakukan input terhadap dataset dan membagi teks menjadi label

Dalam tahap ini dilakukan pengujian yang dimana inputan dataset akan diubah menjadi label, lalu akan dibagi menajdi angka 1 dan 0 , 1 untuk berita fakta dan 0 untuk berita hoax


3. Stemming dan Lemmatization

sumber gambar pribadi

Stemming dan Lemmatization dilakukan  untuk mengurangi kata-kata ke bentuk dasar, dengan mengurangi variasi kata system dapat mengenali pola dan makna.


4. Transformasi data latih dan data uji

sumber gambar pribadi

Data diubah dari format teks ke format numerik dengan menggunakan CountVectorizer. Matriks yang dihasilkan digunakan sebagai input untuk melatih dan menguji model pembelajaran mesin, di mana setiap barisnya sesuai dengan suatu dokumen, dan setiap kolomnya sesuai dengan suatu kata atau kombinasi kata.


5. Pembuatan Model CNN

 sumber gambar pribadi

Pembuatan Convolutional Neural Network (CNN) dengan beberapa lapisan, termasuk lapisan embedding, lapisan konvolusi, dan lapisan dense.


6.  Kompiler model

sumber gambar pribadi

  • Model dikompilasi dengan menggunakan optimizer 'adam' : bertujuan untuk mengoptimalkan parameter model sehingga model dapat belajar dari data dengan lebih efisien.
  • fungsi kerugian 'binary_crossentropy' : digunakan untuk mengukur seberapa baik model memprediksi output dibandingkan dengan nilai sebenarnya. 'binary_crossentropy' digunakan dalam tugas klasifikasi biner. Ini adalah fungsi kerugian umum untuk tugas tersebut.
  • Metric = [‘accuracy’] : Metrics digunakan untuk mengevaluasi performa model selama pelatihan dan pengujian. 'accuracy' adalah metrik yang umum digunakan untuk tugas klasifikasi. Ini mengukur seberapa sering model memberikan prediksi yang benar.
Halaman Selanjutnya


BERI NILAI

Bagaimana reaksi Anda tentang artikel ini?

BERI KOMENTAR

Kirim

Konten Terkait


Video Pilihan

Terpopuler

Nilai Tertinggi

Feature Article

Terbaru

Headline