Abstrak
Di zaman yang terus berkembang dalam teknologi digital, penggunaan aplikasi mobile telah menjadi semakin umum dan signifikan. Oleh karena itu, sangat penting bagi pengembang aplikasi untuk memiliki pemahaman yang mendalam mengenai persepsi pengguna terhadap produk-produk yang mereka ciptakan, baik dari segi positif maupun negatif. Sebagai contoh konkret, ShopeeFood Driver adalah salah satu aplikasi yang sangat populer di Indonesia. Aplikasi ini menawarkan berbagai fitur yang sangat penting bagi para pengemudinya, termasuk penerimaan pesanan, navigasi melalui peta, informasi status pesanan, riwayat pesanan, notifikasi, dan juga fitur untuk melaporkan masalah yang mungkin timbul selama pengiriman. Dalam rangka untuk memahami lebih dalam tentang pengalaman pengguna terhadap aplikasi ini, sebuah analisis sentimen telah dilakukan terhadap ulasan-ulasan yang diberikan oleh pengguna di platform Google Play Store. Metode yang digunakan dalam analisis ini adalah klasifikasi menggunakan algoritma Naive Bayes. Tujuan utama dari analisis ini adalah untuk mendapatkan gambaran yang lebih jelas mengenai pandangan dan opini pengguna terhadap ShopeeFood Driver, serta memberikan masukan yang berguna bagi pengembang untuk meningkatkan kualitas layanan dan fitur-fitur yang mereka sediakan. Hasil dari analisis ini menunjukkan bahwa mayoritas ulasan yang diberikan oleh pengguna cenderung negatif terhadap aplikasi ShopeeFood Driver, dengan persentase sekitar 69% dari total ulasan. Di sisi lain, ulasan positif hanya mencapai sekitar 27%, sedangkan ulasan netral sekitar 5%. Dari temuan ini, dapat disimpulkan bahwa mayoritas pengguna merasa tidak puas dengan pengalaman mereka menggunakan aplikasi ShopeeFood Driver. Namun demikian, ulasan-ulasan positif juga dapat dijadikan sebagai dorongan tambahan bagi pengembang untuk terus mengembangkan dan meningkatkan kualitas layanan serta fitur-fitur yang mereka tawarkan.
Kata kunci---Nave Bayes, ShopeeFood Driver, Sentimen analisis
Abstract
In this ever-evolving era of digital technology, the use of mobile applications has become increasingly common and significant. Therefore, it is crucial for application developers to have a deep understanding of users' perceptions of the products they create, both positively and negatively. As a concrete example, ShopeeFood Driver is one of the highly popular applications in Indonesia. This application offers various essential features for its drivers, including order acceptance, navigation via maps, order status information, order history, notifications, and features for reporting issues that may arise during delivery. In order to gain a deeper understanding of users' experiences with this application, a sentiment analysis has been conducted on the reviews provided by users on the Google Play Store platform. The method used in this analysis is classification using the Naive Bayes algorithm. The main objective of this analysis is to obtain a clearer picture of users' views and opinions on ShopeeFood Driver and to provide useful feedback to developers to improve the quality of services and features they provide. The results of this analysis indicate that the majority of reviews given by users tend to be negative towards the ShopeeFood Driver application, accounting for approximately 69% of the total reviews. On the other hand, positive reviews only make up about 27%, while neutral reviews are approximately 5%. From these findings, it can be concluded that the majority of users are dissatisfied with their experience using the ShopeeFood Driver application. However, positive reviews can also serve as additional motivation for developers to continue developing and improving the quality of services and features they offer.
Keywords---Nave Bayes, ShopeeFood Driver, Sentiment analisis
1. PENDAHULUAN
Pada era teknologi informasi dan komunikasi, seluruh perkara kehidupan manusia menjadi lebih mudah. Dengan perkembangan teknologi saat ini, komunikasi menjadi sangat cepat hingga seolah-olah tanpa adanya jarak. (1) Dengan penetrasi penggunaan smartphone mencapai dua puluh lima persen dari total populasi sekitar enam puluh lima juta orang, banyak individu yang berlomba-lomba untuk mengembangkan aplikasi mobile yang dapat meningkatkan kenyamanan penggunaan smartphone dalam aktivitas sehari-hari. Hal ini mencerminkan kesempatan besar yang dimanfaatkan oleh masyarakat untuk berinovasi dalam ranah teknologi mobile guna mendukung kehidupan sehari-hari yang semakin terkoneksi dan efisien. Terkait dengan temuan virus baru yang muncul di akhir tahun dua ribu Sembilan belas dari Wuhan, China, yaitu virus Corona (Coronavirus Disease 2019), penyebarannya yang semakin meluas, termasuk di Indonesia, mendorong pemerintah Indonesia untuk mengambil langkah-langkah pencegahan yang kuat. Salah satu langkah yang diambil adalah penerapan Pembatasan Sosial Berskala Besar (PSBB) sebagai bagian dari upaya untuk meminimalkan penyebaran virus ini di Indonesia. Langkah-langkah ini mencerminkan respons serius pemerintah dalam menghadapi krisis kesehatan global yang disebabkan oleh pandemi Coronavirus Disease 2019.
Dalam era Revolusi Industri 4.0 saat ini, banyak pelaku bisnis yang telah mengadopsi teknologi untuk memasarkan produk mereka, dengan salah satu contohnya adalah aplikasi Shopee yang mungkin sudah tidak asing lagi. Aplikasi Shopee telah berkembang dari sekadar platform jual-beli barang kebutuhan sehari-hari secara online. Pada tahun 2020, aplikasi ini telah diunduh lebih dari 50 juta kali dan mendapat rating 4+ di mana terdapat berbagai macam ulasan, baik positif maupun negatif. Hal ini menunjukkan bahwa Shopee telah menjadi salah satu aplikasi yang sangat populer dan memainkan peran yang signifikan dalam pasar perdagangan online.
Banyaknya ulasan atau komentar yang ditemukan di aplikasi Shopee di Google Play memiliki dampak yang signifikan bagi perusahaan tersebut. Ulasan tersebut mencakup berbagai jenis tanggapan, baik positif maupun negatif, yang kemudian menjadi sumber informasi penting bagi tim Shopee untuk melakukan evaluasi. Lebih lanjut, Shopee telah memperkenalkan fitur baru bernama Shopee Food, yang memungkinkan pengguna untuk tidak hanya berbelanja kebutuhan sehari-hari secara online, tetapi juga memesan makanan melalui platform aplikasi Shopee. Dengan demikian, Shopee terus berupaya untuk memperluas layanannya dan meningkatkan pengalaman pengguna melalui inovasi produk seperti Shopee Food. (2)
Analisis sentimen, sebuah cabang penting dari text mining, natural language processing, dan kecerdasan buatan, bertujuan untuk menggali opini, sentimen, evaluasi, perilaku, dan emosi individu terhadap berbagai entitas seperti produk, layanan, organisasi, individu, masalah, topik, acara, dan atribut-atributnya. Penelitian ini difokuskan pada penemuan sikap terhadap subjek tertentu dan dapat memberikan informasi mengenai rasio sentimen positif dan negatif terhadap entitas yang dibahas. Meskipun demikian, masih ada beberapa masalah yang harus diatasi dalam pengalaman pengguna Shopee Food, seperti tingkat kepuasan pelanggan yang kurang dan kurangnya preferensi terhadap aplikasi tersebut, yang kemungkinan besar disebabkan oleh kurangnya kegunaan dari aplikasi tersebut.
Algoritma Naive Bayes merupakan metode klasifikasi probabilistik yang relatif sederhana. Metode ini menghitung sejumlah probabilitas dengan menggabungkan frekuensi dan kombinasi nilai dari dataset yang diberikan. (5)
Python adalah salah satu bahasa pemrograman yang sering dipilih oleh pengembang perangkat lunak untuk mengembangkan program mereka. Keunggulan Python terletak pada sintaks yang relatif mudah dipahami, menjadikannya sebagai salah satu bahasa pemrograman tingkat tinggi yang sangat populer. Saat menulis kode program menggunakan Python, penting untuk mematuhi beberapa aturan sintaks untuk menghindari kesalahan atau masalah dalam program. Salah satu aturan sintaks Python yang penting adalah dalam penulisan pernyataan atau perintah. (5)
Dalam penelitian sebelumnya yang berjudul "Penerapan Algoritma Naive Bayes untuk Menganalisis Ulasan Shopee di Google Play Store," ditemukan bahwa pembagian data Hold Out dengan rasio 80:20 menghasilkan tingkat akurasi algoritma sebesar 83%. Hasil ini menunjukkan peningkatan 1% dibandingkan dengan tingkat akurasi rata-rata yang diperoleh dari teknik pembagian data 10-Cross Fold Validation, yang sebesar 82%. (16)
Dalam studi lain yang berjudul "Penerapan Nave Bayes Classifier dan Analisis Asosiasi untuk Evaluasi Sentimen Ulasan Aplikasi E-Commerce Shopee di Google Play," ditemukan bahwa menggunakan model Nave Bayes Classifier menghasilkan tingkat akurasi sebesar 97,4%. Selanjutnya, melalui proses analisis asosiasi teks, ditemukan bahwa pengguna aplikasi Shopee di Indonesia mengulas berbagai aspek seperti aplikasi, ongkir, harga, dan kepuasan. Ulasan positif umumnya mencakup kepuasan terhadap aplikasi, sementara ulasan negatif menyebutkan masalah dengan ongkir, kualitas barang, dan pelayanan penjual. Informasi dari ulasan negatif ini kemudian dipresentasikan dalam bentuk diagram fishbone untuk membantu dalam pemecahan masalah. (15)
Penulis bertujuan untuk menyelidiki pandangan masyarakat terhadap Aplikasi Shopee Food dengan fokus pada peningkatan pengalaman pengguna. Penelitian ini akan mengevaluasi ulasan pengguna terhadap aplikasi ShopeeFood Driver yang dapat diakses melalui Google Play Store, dengan menggunakan metode Nave Bayes untuk mengklasifikasikan ulasan ke dalam kategori sentimen positif, negatif, atau netral. Diharapkan hasil analisis sentimen akan memberikan wawasan berharga kepada pengembang aplikasi untuk meningkatkan kualitas layanan yang mereka tawarkan.
2. METODE PENELITIAN
Dalam penelitian ini, Knowledge Discovery from Data (KDD) digunakan, yang terdiri dari lima tahap utama. Tahapan-tahap tersebut meliputi pemilihan data, persiapan data, transformasi data, pemrosesan data, dan evaluasi. Alur penelitian ini dapat dilihat pada Gambar 1.
2.1 Pengumpulan data
Google Play adalah platform serbaguna yang dapat diakses melalui berbagai platform, baik secara mobile maupun melalui situs web. Ini memungkinkan pengguna untuk mengakses berbagai aplikasi, game, musik, film, dan konten lainnya dengan mudah, sesuai preferensi mereka, di mana pun dan kapan pun. Dalam studi ini, data diambil dari Google Play Store menggunakan perpustakaan Python Google Play Scraper, dimana ulasan pengguna terkait aplikasi ShopeeFood Driver dipilah dengan cermat untuk mendapatkan data yang paling relevan. Total dataset yang terkumpul sebanyak 1500 entri, memastikan ketersediaan data yang memadai untuk analisis yang komprehensif.
2.2 Preprocessing
Sebuah kumpulan konten atau deskripsi dalam sebuah dokumen akan melalui serangkaian langkah untuk menghasilkan kelompok kata atau istilah yang terkait. Langkah-langkah ini penting untuk mengorganisir dan mengelompokkan informasi secara efisien(11). Proses ini meliputi case folding, tokenisasi, penghapusan kata penghenti (stopwords), dan stemming. Tahap text preprocessing merupakan tahap awal dari text mining, yang bertujuan untuk memilih data yang akan diproses dari setiap dokumen. Proses preprocessing penting untuk membersihkan data dari kata-kata yang kurang relevan. Dalam penelitian ini, tahap preprocessing terdiri dari cleaning, normalisasi, dan pemberian label, yang mendasar dalam mempersiapkan data untuk analisis lebih lanjut. (9)
1) Case Folding
Proses Case Folding diterapkan pada setiap dokumen atau kumpulan data yang terdiri dari paragraf berisi konten atau deskripsi. Case folding sendiri merupakan langkah untuk merubah semua teks menjadi huruf kecil dan menghapus karakter di luar jangkauan huruf 'a' hingga 'z'. Dalam proses ini, tanda baca, angka, dan simbol diabaikan. (10)
2) Tokenisasi
Tokenisasi merupakan proses mengubah kalimat menjadi kata-kata terpisah. Proses ini mencakup pemisahan kalimat menjadi unit-unit terpisah berdasarkan pemisah yang digunakan, dalam kasus ini adalah spasi (" "). Langkah ini penting dalam pemrosesan teks karena memungkinkan analisis yang lebih terperinci pada level kata-kata individual. (10)
3) Penyaringan
Pada proses penyaringan, terdapat langkah yang dikenal sebagai penghapusan stopwords. Stopwords merujuk pada kata-kata yang memiliki sedikit makna atau bobot yang kurang signifikan, dan sering kali muncul dalam kumpulan kata. Langkah ini penting untuk membersihkan teks dari kata-kata yang tidak relevan atau tidak memberikan kontribusi signifikan dalam analisis. (10)
4) Stemming
Stemming adalah proses di mana kata diubah menjadi bentuk dasarnya dengan menghilangkan akhiran atau awalan. Langkah ini bertujuan untuk menghasilkan ekspresi yang lebih esensial dari kata tersebut, memfasilitasi analisis dan pengolahan teks yang lebih efisien. (4)
2.3 Tekst Transformation
Tujuan tahap transformasi teks dalam penelitian ini adalah untuk mempersiapkan data teks agar siap diproses dalam analisis data, dengan proses yang terdiri dari transformasi huruf kecil, tokenisasi, penyaringan, penghapusan kata penghenti (stopwords), dan stemming. Proses mengubah input menjadi huruf kecil secara default, yang dikenal sebagai case folding, dilakukan untuk mengubah semua teks menjadi huruf kecil. (9)
2.4 Data Mining
Dalam penerapan Algoritma Naive Bayes untuk klasifikasi, prosesnya terdiri dari dua langkah utama: pelatihan dan pengujian dataset. Langkah pertama adalah pelatihan model, sedangkan langkah kedua adalah pengujian probabilitas dataset. Metode klasifikasi Naive Bayes terbukti efektif dalam mengkategorikan opini, memungkinkan ulasan dari masyarakat untuk diklasifikasikan ke dalam kategori positif, netral, atau negatif dengan akurasi yang baik. (9)
2.5 Evaluasi
Evaluasi merupakan tahap penting dalam mengevaluasi kinerja algoritma klasifikasi yang diterapkan dalam penelitian. Untuk mengukur performansi algoritma, berbagai metrik seperti akurasi, presisi, F-measure, dan recall digunakan(9). Metrik-metrik ini memberikan wawasan yang mendalam tentang kemampuan algoritma dalam mengklasifikasikan data dengan tepat, serta membantu dalam mengidentifikasi kekuatan dan kelemahan yang dimiliki algoritma tersebut. Matriks konfusi memberikan analisis multidimensional yang lebih detail tentang kinerja secara keseluruhan. Ini membantu untuk memperoleh pemahaman yang lebih mendalam tentang sejauh mana algoritma mampu mengklasifikasikan data dengan tepat ke dalam kategori yang benar.
Berikut adalah penjelasan mengenai beberapa metrik evaluasi yang umum digunakan:
1. Akurasi (Accuracy): Menunjukkan seberapa baik prediksi model cocok dengan nilai aktual.
2. Presisi (Precision): Mengukur seberapa tepat atau akurat model dalam memprediksi kelas positif. Presisi juga berguna untuk menilai seberapa sering model memprediksi kelas positif yang sebenarnya positif.
3. Recall: Menghitung berapa banyak nilai aktual positif yang berhasil diidentifikasi oleh model sebagai positif (True Positive). Recall juga berguna dalam situasi di mana kita ingin menghindari False Negative yang tinggi.
4. F-Measure: Merupakan rata-rata tertimbang dari presisi dan recall, memberikan gambaran keseluruhan tentang keseimbangan antara keduanya.
3. HASIL DAN PEMBAHASAN