Dalam data mining, ada 3 teknik yang paling sering disebut atau sudah tidak menjadi asing lagi yaitu klasifikasi, klustering dan asosiasi. Namun sebelum itu, ada beberapa tahap yang untuk melakukan data mining yaitu :
1. Database, kumpulan data yang diambil dari berbagai sumber yang tersimpan di database baik relational ataupun non-relational.
2. Integration, setelah data didapatkan, selanjutnya menyatukan data tersebut atau menyamakan format data secara keseluruhan. Hal ini dilakukan karena data yang dikumpulkan dari tahap database, bisa saja memiliki format yang berbeda-beda.
3. Cleaning, data yang formatnya telah sama,selanjutnya dilakukan pembersihan. Yang berarti dilakukan perbaikan terhadap data yang formatnya telah sama namun tidak memiliki nilai/ bersifat null atau memuat data yang tidak diperlukan.
Yang kemudian setelah melalui ketiga proses tersebut, data di simpan di data warehouse. Dari tahap database -> Integration -> Cleaning -> Warehouse, tahapan tersebut disebut tahap Pre-Processing.
4. Selection, data yang berada di warehouse, selanjutnya di seleksi berdasarkan suatu atribut yang memiliki rujukan atau berdasarkan hasil uji statistik. Hal tersebut biasanya disebut Task-Relevant. Perlu diketahui dalam tahapan ini, data yang ada bisa bertransformasi berdasarkan atribut yang dibutuhkan dalam memproses data.
5. Data Mining, tahapan ini sudah menggunakan algoritma dalam mengolah data-data tersebut berdasarkan teknik yang dipilih (Klasifikasi,Klustering, Asosiasi)
6. Pattern Evaluation, setelah mengolah data tersebut, maka diperolehlah hasil berupa suatu pola untuk diamati statistik pola tersebut.
7. Knowledge, setelah mengamati pola hasil mengolah data maka di dapatkan suatu informasi atau pengetahuan
Tahapan diatas biasa disebut dengan KDD (Knowledge Discovery in Database). Hal terpenting yang dilakukan dalam data mining yaitu mengetahui data yang akan di mining atau yang akan diolah. Untuk mengetahui data yang akan diolah bisa dengan mengetahui objek data dan tipe atribut, deskripsi statistik dasar data, visualisasi data, dan mengukur kesamaan dan ketidaksamaan suatu data. Atribut, merepresentasikan karakter atau ciri-ciri dari objek data tersebut. Adapun beberapa tipe dari atribut yaitu :
1. Nominal, atribut yang digunakan untuk kategori, keadaan, status perkawinan, pekerjaan atau nama benda.