Mohon tunggu...
Theofilus Dewa
Theofilus Dewa Mohon Tunggu... Mahasiswa - Mahasiswa

Gamer, Music Enthusiast, Cybersecurity Analyst

Selanjutnya

Tutup

Ruang Kelas

Penggunaan Algoritma CNN dalam Melakukan Klasifikasi Berita Hoax

26 Januari 2024   07:00 Diperbarui: 26 Januari 2024   07:01 127
+
Laporkan Konten
Laporkan Akun
Kompasiana adalah platform blog. Konten ini menjadi tanggung jawab bloger dan tidak mewakili pandangan redaksi Kompas.
Lihat foto
Bagikan ide kreativitasmu dalam bentuk konten di Kompasiana | Sumber gambar: Freepik

Di zaman yang berkembang ini, kegiatan tukar menukar informasi sering terjadi apalagi pada platform sosial media ,kita dapat melihat cuitan atau postingan yang diupload pada setiap akun yang terdapat didalmanya. Namun apakah Informasi yang terdapat pada akun tersebut dapat dipercaya atau mengandung hoax itu sangat susah dibedakan dan tak jarang banyak orang jatuh dalam berita hoax karena kurangnya pengetahuan untuk membedakan berita fakta ataupun hoax .

Deep learning menggunakan metode CNN merupakan metode yang biasanya digunakan untuk pengenalan pola spasial dan pengolahan citra , akan tetapi dapat digunakan juga dalam klasifikasi berita hoax yang dimana sangat membantu apalagi menjelang musim pemilu 2024 yang akan diadakan 1 Bulan lagi.

Cara kerja metode ini kurang lebih sebagai berikut:

1. Pengumpulan Dataset

Dalam pengujian ini dilakukan pengumpulan dataset ,yang dimana data yang ada diambil dari Kaggle yang berisi berita Hoax dan Fakta. Sumber : https://www.kaggle.com/datasets/emineyetm/fake-news-detection-datasets)


2. Melakukan input terhadap dataset dan membagi teks menjadi label

Dalam tahap ini dilakukan pengujian yang dimana inputan dataset akan diubah menjadi label, lalu akan dibagi menajdi angka 1 dan 0 , 1 untuk berita fakta dan 0 untuk berita hoax


3. Stemming dan Lemmatization

sumber gambar pribadi
sumber gambar pribadi
Stemming dan Lemmatization dilakukan  untuk mengurangi kata-kata ke bentuk dasar, dengan mengurangi variasi kata system dapat mengenali pola dan makna.


4. Transformasi data latih dan data uji

sumber gambar pribadi
sumber gambar pribadi
Data diubah dari format teks ke format numerik dengan menggunakan CountVectorizer. Matriks yang dihasilkan digunakan sebagai input untuk melatih dan menguji model pembelajaran mesin, di mana setiap barisnya sesuai dengan suatu dokumen, dan setiap kolomnya sesuai dengan suatu kata atau kombinasi kata.


5. Pembuatan Model CNN

 sumber gambar pribadi
 sumber gambar pribadi

Pembuatan Convolutional Neural Network (CNN) dengan beberapa lapisan, termasuk lapisan embedding, lapisan konvolusi, dan lapisan dense.


6.  Kompiler model

sumber gambar pribadi
sumber gambar pribadi
  • Model dikompilasi dengan menggunakan optimizer 'adam' : bertujuan untuk mengoptimalkan parameter model sehingga model dapat belajar dari data dengan lebih efisien.
  • fungsi kerugian 'binary_crossentropy' : digunakan untuk mengukur seberapa baik model memprediksi output dibandingkan dengan nilai sebenarnya. 'binary_crossentropy' digunakan dalam tugas klasifikasi biner. Ini adalah fungsi kerugian umum untuk tugas tersebut.
  • Metric = [‘accuracy’] : Metrics digunakan untuk mengevaluasi performa model selama pelatihan dan pengujian. 'accuracy' adalah metrik yang umum digunakan untuk tugas klasifikasi. Ini mengukur seberapa sering model memberikan prediksi yang benar.

HALAMAN :
  1. 1
  2. 2
Mohon tunggu...

Lihat Konten Ruang Kelas Selengkapnya
Lihat Ruang Kelas Selengkapnya
Beri Komentar
Berkomentarlah secara bijaksana dan bertanggung jawab. Komentar sepenuhnya menjadi tanggung jawab komentator seperti diatur dalam UU ITE

Belum ada komentar. Jadilah yang pertama untuk memberikan komentar!
LAPORKAN KONTEN
Alasan
Laporkan Konten
Laporkan Akun