Hai teman-teman, seperti yang sudah saya jelaskan di artikel sebelumnya tentang data mining dalam kehidupan sehari-hari, pastinya teman-teman sudah tahu apa itu data mining dan contohnya dalam lingkup kehidupan sehari-hari. Nah sekarang kita akan memahami bagaiman proses suatu data menjadi data mining dan apa saja atribut pada data mining.Â
Data mining merupakan bagian dari tahapan proses Knowledge Discovery in Database (KDD). Dengan data mining, kita dapat melakukan pengklasifikasian, memprediksi, memperbaiki dan mendapatkan informasi lain yang bermanfaat dari kumpulan data dalam jumlah yang besar.Â
Untuk itu KDD dan data mining seringkali digunakan secara bergantian untuk menjelaskan proses menemukan informasi tersembunyi dalam data yang cukup besar. Namun kedua istilah ini tentu memeiliki konsep yang berbeda, tetapi saling berkaitan satu sama lain karena salah satu tahap dalam proses KDD adalah data mining.
Adapun  gambar  di atas dan tahapan Knowledge Discovery in Database (KDD) sebagai berikut:
1. Pada tahap awal ini kita melakukan pengumpulan data, dimana data masih berupa data mentah.
2. Data Integration. Setelah data terkumpul maka kita akan melakukan penyatuan data dari berbagai sumber yang kemudian  menjadi sebuah data warehause.
3. Data Cleaning. Tahap ini kita akan membuang data yang tidak konsisten dan kemudian memperbaiki data yang belum lengkap.
4. Selection. Tahap ini untuk menyeleksi data yang akan dipakai kemudian di ubah menjadi bentuk yang sesuai untuk di-mining disebut data transformation.
5. Data Mining. Pada tahap ini kita akan menggunakan metode data mining.