Mohon tunggu...
Faizul Huda Alafi
Faizul Huda Alafi Mohon Tunggu... Mahasiswa - Mahasiswa Universitas Islam Negeri Maulana Malik Ibrahim Malang

Seorang mahasiswa teknik informatika yang suka dengan dunia game.

Selanjutnya

Tutup

Ilmu Alam & Tekno

Naive Bayes Ungguli Transformer? Rahasianya di Pra-Pemrosesam

25 September 2024   13:05 Diperbarui: 25 September 2024   13:13 53
+
Laporkan Konten
Laporkan Akun
Kompasiana adalah platform blog. Konten ini menjadi tanggung jawab bloger dan tidak mewakili pandangan redaksi Kompas.
Lihat foto
Bagikan ide kreativitasmu dalam bentuk konten di Kompasiana | Sumber gambar: Freepik

Dari penelitian Siino et al. (2023), jelas bahwa pra-pemrosesan teks masih memiliki tempat yang sangat penting dalam pengembangan model pembelajaran mesin, termasuk model Transformer yang canggih sekalipun. Meskipun Transformer mampu menangani berbagai tugas pemrosesan bahasa alami dengan baik, mereka tetap menunjukkan peningkatan performa yang signifikan saat dipadukan dengan teknik pra-pemrosesan yang tepat. Dengan peningkatan akurasi hingga 25% pada model XLNet di dataset IMDB, serta keunggulan model tradisional seperti Naive Bayes dalam beberapa kasus, penelitian ini menegaskan kembali bahwa pra-pemrosesan harus dilihat sebagai langkah kritis dalam pipeline NLP.

Implikasi dari temuan ini adalah bahwa praktisi dan peneliti di bidang NLP harus mempertimbangkan untuk tidak sepenuhnya bergantung pada kecanggihan model Transformer tanpa memperhatikan kebersihan data. Memilih teknik pra-pemrosesan yang sesuai dengan jenis data dan tugas spesifik dapat menghasilkan peningkatan performa yang signifikan, baik dalam hal akurasi maupun efisiensi komputasi.

Penelitian ini menawarkan panduan penting untuk penelitian dan aplikasi masa depan, terutama dalam menghadapi volume data yang semakin besar dan beragam.

Referensi :

Siino, M., Tinnirello, I., & La Cascia, M. (2023). Is text preprocessing still worth the time? A comparative survey on the influence of popular preprocessing methods on Transformers and traditional classifiers. Information Systems, 121, 102342. https://doi.org/10.1016/j.is.2023.102342
 

Baca konten-konten menarik Kompasiana langsung dari smartphone kamu. Follow channel WhatsApp Kompasiana sekarang di sini: https://whatsapp.com/channel/0029VaYjYaL4Spk7WflFYJ2H

HALAMAN :
  1. 1
  2. 2
Mohon tunggu...

Lihat Konten Ilmu Alam & Tekno Selengkapnya
Lihat Ilmu Alam & Tekno Selengkapnya
Beri Komentar
Berkomentarlah secara bijaksana dan bertanggung jawab. Komentar sepenuhnya menjadi tanggung jawab komentator seperti diatur dalam UU ITE

Belum ada komentar. Jadilah yang pertama untuk memberikan komentar!
LAPORKAN KONTEN
Alasan
Laporkan Konten
Laporkan Akun