Data merupakan kumpulan fakta bisa berupa kata-kata, simbol, ataupun angka yang diperoleh melalui proses pencarian dan pengamatan berdasarkan sumber tertentu. Data masih bersifat mentah sehingga seseorang belum bisa mendapatkan suatu informasi utuh dari data tersebut.Â
Apa itu Data Mining?
Data Mining adalah proses pencarian pengetahuan dan informasi penting dari sejumlah data yang besar dengan menggunakan pendekatan statistika, matematika, sampai memanfaaatkan teknologi artificial intelligence.
Knowledge Discovery In Databases (KDD) adalah sebuah istilah dalam data mining untuk mencari informasi-informasi penting untuk menemukan pola dalam data menggunakan algoritma tertentu. Pola-pola yang telah terbentuk bisa dimanfaatkan untuk memprediksi kejadian dimasa mendatang yang dapat diketahui dari berbagai variabel-variabel pada data. Inilah salah satu pengaplikasian data mining yaitu predictive.
Knowledge Discovery in Database (KDD)
Knowledge Discovery in Database (KDD) merupakan proses penemuan pengetahuan dalam database. Secara lengkap KDD didefinisikan sebagai proses ekstraksi atau identifikasi pola, pengetahuan dan informasi potensial dari sekumpulan data yang besar. Pengetahuan dan informasi yang dihasilkan dari KDD bersifat sah, baru, mudah dimengerti, dan bermanfaat.
Dalam proses data mining terdapat beberapa teknik untuk menganalisis data. KDD sendiri terdapat beberapa tahapan proses antara lain adalah sebagai berikut :
1. Â Data Cleaning
Data cleaning adalah proses pembersihan data dari adanya noise atau duplikat data.
2. Â Preprocessing
Tahap preprocessing meliputi proses pembersihan (cleaning) Â dengan membuang duplikasi data, memeriksa data yang inkosisten, dan memperbaiki kesalahan pada data misalkan typo.
3. Â Transformation
Pada tahap ini mentransformasi atau mengubah bentuk data yang belum mempunyai entitas yang jelas ke dalam bentuk data yang valid atau siap untuk dilakukan proses data mining. Â
4. Â Data Mining
Pada tahapan ini menerapkan metode atau algoritma yang sesuai dengan informasi atau pengetahuan apa yang akan digali atau dicari, seperti menerapkan algoritma atau metode untuk klasifikasi, prediksi, clustering dan lain sebagainya.Â
5. Â Evaluation
Tahap ini merupakan tahapan terakhir yang dilakukan dengan mengevaluasi output dari proses data mining agar mudah untuk dipahami dan dimengerti.Â
Penerapan data mining sebenarnya sudah sering kita temui dalam kehidupan sehari-hari. Misalnya ketika seseoranng menggunakan layanan streaming film atau musik, seringkali banyak rekomendasi konten musik yang sesuai dengan selera pengguna. Hal itu merupakan contoh penerapan data mining. Penyedia layanan streaming mencatat semua jenis konten yang ditonton atau didengarkan. Kemudian, mengolah data tersebut untuk merekomendasikan konten-konten sesuai minat kepada pengguna.
Sekian dan terima kasih. Semoga bermanfaat.
Baca konten-konten menarik Kompasiana langsung dari smartphone kamu. Follow channel WhatsApp Kompasiana sekarang di sini: https://whatsapp.com/channel/0029VaYjYaL4Spk7WflFYJ2H