Salah satu yang dipelajari dalam data mining (penambangan data) adalah text mining. Text mining merupakan teknik penambangan data (teks) dimana sumber data dapat berupa dokumen (contoh: berita). Tujuan teknik ini adalah mencari kata atau gabungan kata yang dapat mewakili sebuah berita, sehingga diakhir proses paling tidak diketahui keterhubungan antar berita. Lebih jauh tentang teknik text mining silahkan baca [1].
Dengan demikian dapat dikatakan bahwa teknik ini merupakan salah satu teknik untuk melakukan analisa data/informasi untuk memperoleh pengetahuan. Pengetahuan ini dapat dilakukan untuk melakukan suatu prediksi atas sebuah peristiwa.
Misalnya, kita akan melakukan prediksi pemenang Pilres 9 Juli 2014 dengan menggunakan pengetahuan dari berita, sumber berita adalah kompas.com.
Kompas.com sebagai portal berita profesional memberikan akses "lebih" kepada pembaca beritanya. Setiap berita, selain dibaca, dapat juga dishare, maupun dikomentari. Berdasarkan data yang bersumber dari akses "lebih" tersebut, kompas.com memberikan suatu pengetahuan. Pengetahuan tersebut terangkum dalam TOPIK PILIHAN. Topik pilihan pada kompas.com tentu saja diperoleh melalui sebuah teknik text mining (dugaan sementara: kompas.com memiliki divisi research untuk ini). Pada topik pilihan tersebut ada tulisan
Pengetahuan yang dimaksud ada pada Gambar 1.
[caption id="attachment_339892" align="aligncenter" width="688" caption="Gambar 1. Pengetahuan dari Kompas.com, diambil Pukul 09:00 WITA"][/caption]
Berdasarkan Gambar 1 diketahui bahwa topik Jokowi-JK (pasangan Capres No. Urut 2) adalah topik berita paling teratas,sedangkan topik Prabowo-Hatta (pasangan Capres No. Urut 1) berada beberapa tingkat dibawah. Dengan kata lain topik Jokowi-JK merupakan topik berita yang "disenangi" oleh kontibutor maupun pembaca kompas.com.
[caption id="attachment_339897" align="aligncenter" width="602" caption="Gambar 2. Pengetahuan dari Kompas.com, diambil 10.30 WITA"]
Berdasarkan Gambar 2 telihat bahwa topik Prabowo-Hatta lebih "disenangi" dibanding dengan topik Jokowi-JK.
Dengan demikian arah berita di kompas.com kadang ke arah 2, kadang ke arah 1. Tidak seperti berita di media lain, silahkan baca beberapa artikel berikut [2].
Jika digunakan untuk melakukan prediksi pemenang pada Pilpres 9 Juli 2014 nanti maka secara sederhana hasilnya adalah sebagai berikut
Jokowi-JK = 3
Prabowo-Hatta = 3,5
Jika dikonversi ke rangking, maka Jokowi-Jk menempati rangking pertama dan Prabowo-Hatta menempati rangking kedua.
Demikian
Referensi
[1] http://seagatejogja.blog.ugm.ac.id/2010/03/29/document-clustering-pendekatan-analisis-isi-dokument/
Baca konten-konten menarik Kompasiana langsung dari smartphone kamu. Follow channel WhatsApp Kompasiana sekarang di sini: https://whatsapp.com/channel/0029VaYjYaL4Spk7WflFYJ2H