Data mining sering disebut dengan istilah Knowledge Discovery in Database (KDD). KDD bekerja untuk melakukan konversi raw data ke dalam sebuah informasi yang dituju. Berikut ini merupakan proses dalam KDD, yaitu sebagai berikut:
Terkait gambar yang disajikan di atas, berikut ini merupakan detail penjelasannya, yaitu sebagai berikut:
- Input data berfungsi untuk memasukkan data sesuai dengan kebutuhan sekaligus dapat disimpan dalam berbagai format file seperti flat file dan spreadsheet maupun tabel relasional.
- Setelah data berhasil dimasukkan, langkah selanjutnya yaitu tahapan preprocessing. Preprocessing bertujuan untuk mengubah data input mentah ke dalam format yang sesuai untuk analisis selanjutnya. Pada tahap ini, langkah-langkah yang terlibat yaitu seperti menggabungkan data dari berbagai sumber, cleaning data untuk membuang noise dan observasi yang duplikat serta menyeleksi fitur dan rekaman yang relevan untuk pekerjaan data mining. Perlu diketahui, tahapan preprocessing merupakan tahapan dengan langkah yang paling banyak memakan waktu dalam proses KDD.
- Tahapan selanjutnya yaitu data mining. Pada tahap ini, data mining sering kali diintegrasikan dengan Decision Support System (DSS). Integrasi tersebut biasanya memerlukan sebuah tools pendukung untuk dapat digunakan, diuji sekaligus sebagai syarat untuk melangkah ke tahap berikutnya.
- Kemudian, tahapan berikutnya yaitu post-processing. Post-processing bertujuan untuk memvisualisasikan segala kemungkinan yang dilakukan oleh seorang analis data dalam mengeksplor data beserta hasilnya dari berbagai sudut pandang. Biasanya, seorang analis data menggunakan metode pengujian hipotesis untuk membuang hasil data mining yang tidak diperlukan sekaligus merilis informasi resmi dari hasil kegiatan pengolahan yang sebelumnya sudah dilaksanakan.
Berkaitan dengan proses KDD di atas, secara khusus data mining menggunakan ide-ide seperti pengambilan contoh, estimasi dan pengujian hipotesis melalui statistika, algoritma pencarian, teknik pemodelan dan teori pembelajaran dari kecerdasan buatan, pengenalan pola dan pembelajaran mesin.
Selain itu, data mining juga mengadopsi ide-ide lain dari beberapa area seperti optimisasi, pemrosesan sinyal, teori informasi, visualisasi, evolutionary computing dan information retrieval.Â
Perlu diketahui bahwa seluruh area yang sudah diadopsi tersebut memberikan sejumlah kontribusi melalui sistem basis data, seperti menyediakan tempat penyimpanan yang efisien dan dapat melakukan proses indexing dan query.
2. Fungsi Data Mining
Berikut ini merupakan fungsi dari data mining, yaitu sebagai berikut:
- Association
Association merupakan proses mengidentifikasi sebuah relasi dari setiap kejadian atau peristiwa yang sudah terjadi pada waktu tertentu. Contohnya yaitu seperti isi dari keranjang belanja.
- Classification
Classification merupakan proses penemuan model yang menjelaskan suatu konsep sekaligus berfungsi untuk menyimpulkan beberapa definisi pada suatu grup. Contohnya yaitu seperti pelanggan suatu perusahaan e-commerce yang berpindah ke kompetitor saingan perusahaan tersebut.
- Clustering