2.1Pengumpulan Data atau Screpping
Proses pengumpulan data dikumpulkan dari content pengguna aplikasi Lightroom yang ada pada google play store. Data tersebut kemudian dikelola dengan masuk ke tahap preprocessing.
2.2Preprocessing
Tahap selanjutnya yaitu melakukan persiapan dataset yang telap didapatkan, agar terolah pada saat melakukan permodelan. Pada tahap ini juga terdiri dari membangun data, dan membersihkan data agar siap untuk dikelola ke tahap selanjutnya. Tahap preprocessing diantaranya yaitu:
1)Tokenize
Proses tokenisasi merupakan proses dimana memecahkan sekumpulan kalimat atau karakter menjadi potongan kata sesuai kebutuhan (token)
2)Normalisasi
Proses normalisasi mempermudah proses analisis sentiment yang dilakukan menggunakan penggantian pada kata yang tidak baku menjadi kata yang baku.
3)Stemming
Stemming merupakan kelanjutan dari proses tokenize yang dimana menghilangkan imbuhan yang terdapat pada masing -- masing kata dengan mengganti menjadi bahasa Indonesia.
4)Stopword Removal