Sejarah Data Mining
Data mining mulai berkembang pada tahun 1990-an sampai sekarang diakibatkan pertumbuhan data dan perkembangan teknologi. Sebelum tahun 1990-an dikenal dengan istilah computational science, dimana beberapa disiplin ilmu muncul untuk bekerja sama dan menyimpulkan untuk menciptakan sebuah pengetahuan yang dapat dimanfaatkan untuk melakukan simulasi-simulasi dengan komputer yang bersifat paralel computation.Â
Mundur lebih jauh lagi yaitu pada tahun 1600 sampai 1950-an dikategorikan menjadi theoretical science dimana teori-teori dasar dari permasalahan jaman kini ditemukan pada masa ini misalnya teori kalkulus, fisika modern mulai muncul.
Database dan data mining memiliki keterikatan yang kuat. Untuk bisa melakukan "mining" data pertama-tama anda harus mengusai dasar-dasar ilmu tentang database. Adapun database sendiri adalah kumpulan data yang terorganisir yang umumnya diakses, disimpan dan dikelola secara elektronik.
Proses Mining Data
Secara teknis proses mining data dapat dikatakan sebagai suatu proses yang iteratif yang didalamnya terdapat langkah yang dilalui. Landasan paling dasar ketika berbicara tentang data mining berkaitan dengan database dan tidak hanya satu database didalamnya melainkan terdapat kumpulan database yang saling berkaitan.Â
Dalam proses melakukan mining data pertama-tama akan diperlukan database kemudian akan lanjut ke data integration kemuadian data cleaning untuk membuang data yang tidak sesuai syarat yang ditentukan misalnya masih ada data null, data yang tidak sesuai format dan sebagainya. Setelah tahap cleaning maka data akan disimpan di data warehouse setelah melalui tahap ini akan dilakukan proses pemilihan yang didasari dengan kriteria data relavan yang telah ditentukan.Â
Sampai ke tahapan ini beberapa sumber menyebutnya dengan tahapan data pre-processing setelahnya dilakukan proses data mining lalu dilakukan proses evaluasi pola dan terakhir didapatkan pengetahuan atau informasi yang bisa digunakan dalam pengambilan keputusan.Â