Penggunaan fasilitas internet di Indonesia mencapai 73,7% dari total penduduk diawal 2022. Ini meningkat secara signifikan sebesar 2,1 juta (+1,0 persen) antara tahun 2021dan 2022 (Kemp, 2022). Pertumbuhan ini berpeluang menjadikan Indonesia sebagai pasar bagipasar (Rohman et al., 2020). Marketplace merupakan salah satu media transaksi, salah satufitur yang tersedia adalah review dan rating (Wang et al., 2022).Â
Secara umum, menghasilkan setiapulasan produk terkait dengan tingkat peringkat, membuat pengguna meninggalkan komentar yang bias. Sebagai contoh,untuk pengguna yang toleran, meskipun pengguna sangat tidak puas dengan produk, peringkatnya tetapmembuatnya memberikan komentar netral yang tidak dapat menunjukkan kualitas produk.Â
On lineulasan juga dapat digunakan sebagai sumber data untuk pengambilan keputusan baik dalam bisnis maupun manajemen(Bi et al., 2019). Ulasan pelanggan sangat penting untuk mendukung keputusan dalam membeli dan menjual
transaksi karena dengan perkembangan e-commerce, ulasan palsu semakin banyakmenyebabkan konsumen takut ditipu saat berbelanja online (Wang et al., 2022).
Pelangganulasan sangat penting karena mereka menentukan kepuasan pengguna atau pembeli dengan suatu produk (Kevin etal., 2020). Untuk itu, dalam mengelompokkan review online agar dapat diolah dan digunakansebagai strategi, perlu ada solusi yaitu analisis sentimen. Analisis sentimen bisamenjawab masalah klasifikasi teks dengan baik seperti yang dilakukan dalam mengklasifikasikan data (Warsito &Pratama, 2020).
Beberapa teknik yang dapat digunakan untuk mengetahui review pengguna terhadap suatu produk adalah sentimenanalisis (Lestandy et al., 2021). Riset produk juga pernah dilakukan oleh Jayadi (2022).
membandingkan beberapa algoritme pembelajaran mesin untuk menentukan cara terbaik untuk sentimenanalisis review produk yang terdapat pada lima E-Commerce di Indonesia. Salah satu algoritmaPerbandingan Algoritma Nave Bayes dan XGBoost pada Klasifikasi Teks Review Produk Lokal144yang sering digunakan dalam analisis sentimen adalah Naive Bayes.Â
Nave Bayes Classifier (NBC) adalahmetode klasifikasi pada teorema. Metode klasifikasi menggunakan probabilitas dan statistikmetode yang dikemukakan oleh ilmuwan Inggris Thomas Bayes (Permadi, 2020), yang memprediksipeluang masa depan berdasarkan pengalaman sebelumnya,Â
sehingga dikenal sebagai Teorema Bayes(Yennimar & Rizal, 2019) seperti yang dilakukan oleh Yennimar & Rizal (2019) menggunakan Tetangga Terdekat(KNN) dan algoritma Nave Bayes dimana Nave Bayes memiliki akurasi yang lebih tinggi yaitu 89,00% dariKN.
Kajian lain terkait Nave Bayes dalam mengklasifikasi review produk juga dilakukanoleh Rohman dkk. (2020) dimana KNN menghasilkan akurasi yang lebih tinggi yaitu 76,2% dibandingkan denganNave Bayes 52,4%, untuk hasil akurasi belum bisa dikatakan optimal karena masih adabeberapa ulasan spam dan tidak relevan.Â
Hal ini menjadikan modal utama bagi penelitian saat ini untuk menambahtahap pembersihan data dimana nantinya tahap ini akan menghilangkan review dan spam yang tidak relevan sehinggadata dapat diklasifikasikan dengan baik. Penelitian ini juga akan mengoptimalkan dalam hal preprocessingsehingga masalah seperti data yang salah klasifikasi dapat diatasi.
Tahap preprocessing teks, perlu menambahkan normalisasi kata, menurutRohman dkk. (2020) normalisasi kata mampu mendeteksi kata-kata yang tidak baku dansingkatan sehingga mereka dapat mengoreksi kata secara otomatis agar sesuai dengan EYD.Â