Dalam dunia digital yang terus berkembang, ulasan hotel telah menjadi salah satu sumber informasi utama bagi calon pelanggan. Analisis sentimen, khususnya analisis sentimen berbasis aspek (Aspect-based Sentiment Analysis atau ABSA), telah memainkan peran kunci dalam memahami preferensi dan pengalaman pelanggan dalam ulasan ini. Namun, seiring dengan perkembangan teknologi dan peningkatan kompleksitas dalam kalimat ulasan, masalah aspek implisit menjadi tantangan yang semakin signifikan. Artikel terbaru yang berjudul "Attention-based Sentence Extraction for Aspect-based Sentiment Analysis with Implicit Aspect Cases in Hotel Review Using Machine Learning Algorithm, Semantic Similarity, and BERT" oleh Budi Harjo dan Rachmad Abdullah (2023) memperkenalkan pendekatan inovatif untuk mengatasi masalah ini dan meningkatkan akurasi dalam analisis sentimen ulasan hotel.
Mengatasi Aspek Implisit dalam Ulasan Hotel
Penting untuk memahami bahwa dalam dunia analisis sentimen, ulasan hotel adalah salah satu bidang yang paling menantang. Sebuah ulasan hotel dapat mencakup berbagai aspek, mulai dari lokasi dan pelayanan hingga fasilitas dan kebersihan. Studi sebelumnya telah berfokus pada analisis sentimen dalam kalimat eksplisit dan implisit, tetapi telah ada kekurangan dalam memahami kasus-kasus aspek implisit yang dapat dipengaruhi oleh struktur kalimat yang kompleks.
Salah satu tantangan utama dalam menghadapi ulasan dengan aspek implisit adalah disambiguasi pengertian kata (Word Sense Disambiguation atau WSD). Bagaimana kita dapat dengan benar mengidentifikasi dan menilai aspek-aspek tertentu dalam ulasan jika kata-kata yang digunakan dalam konteks tersebut memiliki banyak makna yang berbeda? Inilah pertanyaan yang menciptakan latar belakang untuk penelitian yang diusulkan dalam makalah ini.
Metode Ekstraksi Kalimat Berbasis Perhatian
Dalam upayanya untuk mengatasi masalah aspek implisit dalam ulasan hotel, Budi Harjo dan Rachmad Abdullah memperkenalkan metode ekstraksi kalimat berbasis perhatian. Pendekatan ini berfokus pada penggunaan perhatian untuk mengidentifikasi kalimat-kalimat yang paling relevan dalam ulasan hotel yang berkaitan dengan aspek-aspek tertentu. Ini adalah langkah penting dalam memahami sentimen yang terkandung dalam ulasan yang mungkin terasa rumit atau ambigu.
Pertama-tama, proses ini melibatkan pra-pemrosesan data, yang mencakup berbagai tahap seperti pelipatan kasus, pemfilteran, normalisasi, penghapusan kata penghenti, stemming, dan tokenisasi. Dalam tahap ini, data ulasan dibersihkan dan dipersiapkan untuk analisis lebih lanjut.
Metode ini kemudian menggunakan algoritma berbasis aturan untuk mengidentifikasi istilah-aspek dan istilah-opini. Penting untuk mengenali aspek dan pendapat yang mungkin terkandung dalam ulasan, terutama ketika kata-kata tersebut memiliki makna yang bervariasi.
Proses kategorisasi aspek adalah langkah berikutnya, yang melibatkan penggunaan hasil dari pasangan aspek eksplisit dan istilah-opini sebagai masukan. Kata kunci aspek digunakan untuk mengidentifikasi istilah-aspek eksplisit dalam ulasan, sedangkan kata benda (NN) digunakan sebagai tanda identifikasi untuk istilah-aspek implisit. Identifikasi istilah-aspek implisit dilakukan dengan membandingkan mereka dengan korpus aspek implisit.
Kunci dalam metode ini adalah penggunaan BERT, yang merupakan singkatan dari Bidirectional Encoder Representation from Transformers. BERT adalah salah satu model pemodelan bahasa yang paling canggih saat ini. Dalam tahap ini, BERT digunakan untuk mengukur kesamaan semantik antara kalimat-kalimat yang ada dalam ulasan hotel.