Data Mining merupakan sebuah pengetahuan atau ekstraksi pola yang menarik di mana sebelumnya tidak diketahui, berpotensi berguna, pernyataan teori yang tidak mudah untuk dibuktikan (non-trivial), dan makna yang tersirat (implisit).
Knowlegde discovery in Database (KDD) merupakan sebuah ekstraksi pengetahuan, intelijen bisnis, analisis data/pola, arkeologi data, pengumpulan data, dan penggalian/pencarian data, dll.
Knowlegde discovery Process memiliki beberapa tahapan antara lain yaitu :
1. Data Integration : proses menyatukan atau menggabungkan antara dua atau lebih data dari database yang sumbernya berbeda-beda ke dalam sebuah penyimpanan atau yang disebut dengan Data Warehouse (Gudang data).
2. Data Cleaning : proses pemeriksaan Kembali untuk memastikan apakah data tersebut terdektesi error atau corrupt yang kemudian akan diperbaiki atau dihapus data yang tidak digunakan. Setelah data digabunggkan lalu di simpan ke dalam Data Warehouse dan sudah melalui proses Data Cleaning maka selanjutnya data akan diseleksi.
3. Data Selection : proses mengidentifikasi pada semua sumber data yang relevan dan memilih Sebagian data yang akan diperlukan saja menggunakan analysis task. sehingga terbentuklah data yang disebut dengan Task-Relevant Data.
4. Data Tranformation : proses transformasi dari data relevan menjadi data mining.
5. Data Mining : proses untuk mengekstrak pola yang menarik pada data yang relevan sebelum dikirim ke Patterns Evaluation dengan menerapkan intelligent methods.
6. Patterns Evaluation : proses evaluasi pola yang betul-betul menarik dan akan menjadi sebuah pengetahuan yang berdasarkan banyaknya jumlah ketertarikan.
7. Knowlage Presentation : merupakan proses akhir yang mana data telah melalui enam proses KDD selanjutkan akan ditampilkan atau dipublikasikan kepada pengguna.
- Atribut pada data mining
Atribut merupakan bagian dari data atau properti yang dapat mewakili sebuah karakteristik dari objek data. Adapun jenis-jenis atribut pada data mining yaitu :