Halo teman-teman, kembali lagi kita akan membahas terkait data mining. Seperti yang kita ketahui sebelumnya, bahwa data mining sendiri merupakan proses pengumpulan dan pengolahan data dalam jumlah besar, yang nantinya dapat diperoleh hasil akhir berupa tinjuauan dalam pengambilan suatu keputusan.
...
Ketika kita memiliki banyak data, terdapat teknik untuk mengelompokkan data tersebut yaitu klasifikasi, cluster, dan juga ada asosiasi. Klasifikasi dimana ialah proses untuk menemukan model atau fungsi yang menggambarkan dan membedakan kelas data atau konsep dengan tujuan memprediksi keals untuk data yang tidak kita ketahui kelasnya.Â
Cluster ialah proses mengelompokkan satu set abstrak kedalam kelas objek yang sama. Yang ketiga ialah asosiasi, ialah pencarian aturan-aturan asosiasi yang memperlihatkan kondisi nilai atribut yang sering terjadi bersamaan dalam sekumpulan data yang dimiliki.
Data mining juga kadang disebut dengan Knowledge Discovery in Database atau KDD. Proses KDD secara garis besar dapat dibagi menjadi 7 tahapan diantaranya, yang paling pertama ialah harus memiliki dua sampai lebih data didalam sebuah database. Selanjutnya atau yang kedua ialah integrasi data. Pada tahapan integrasi data, beberapa sumber data dapat kita kombinasikan atau menyatukan banyak database yang memiliki data berbeda.
Kemudian setelah melakukan integrasi data, tahapan ketiga ialahh pembersihan data/ data cleaning. Yang dimana, untuk membersihkan data yang tidak wajar menjadi wajar (memeriksa/konfirmasi data yang tidak benar), mungkin saja berisi kosong atau kesalahan domain data. Atau bisa dikatakan juga untuk menghilangkan noise dan data yang tidak konsisten.
Tahapan ke empat ialah data transformasi, dimana mentransformasikan data sehingga isi yang dibutuhkan bisa mengisi. Kemudian tahapan kelima ialah data selection, dimaan data yang relevan dengan tugas analisis yang diambil dari database.Â
Tahapan pertama hingga keempat merupakan bentuk preprocessing data, dimana data dipersiapkan untuk data mining. Dimana menunjukkan bahwa data mining sebagai salah satu langkah dalam proses KDD, dikarenakan dapat mengungkapkan pola-pola tersembunyi yang digunakan untuk evaluasi.
Sesuai penjelasan diatas, maka tahapan selanjutnya ialah data mining. Yang dimana, pada tahapan ini memasukkan algoritma yang pas untuk database yang kita masukkan.Â
Juga proses esensial atau metode cerdas yang diaplikasikan untuk mengekstrak data pola yang dimiliki. Tahapan selanjutnya ialah meng evaluasi pola, dimana untuk mengidentifikasi pola yang benar-benar menarik yang akan mewakili pengetahuan.
Terakhir, tahapan ketujuh ialah pengetahuan atau knowledge. Dimana visualisasi dan teknik dari representaso pengetahuan ini digunakan untuk menyajikan pengetahuan hasil data mining kepada pengguna... Demikian ketujuh tahapan dari  Knowledge Discovery in Database.