Data mining adalah proses pengumpulan dan pengolahan data dalam jumlah besar, yang nantinya dapat diperoleh hasil akhir berupa tinjauan dalam pengambilan keputusan.
...
Terjadinya penetrasi teknologi informasi di bidang komersial atau toko e-commerce, dimana akhirnya dapat menghasilkan data yang laju pertumbuhannya sangat signifikan atau terjadi pertumbuhan yang luar biasa. Data-data tersebut bisa diperoleh dari tools data collection yang diautomasi (sensor dan sebagainya), database system, website, atau Society computerize Society.
Yang kita alami sekarang ialah, kita sudah sangat kaya terhadap data, lalu "Apakah kita bisa memanfaatkan data-data tersebut? Mengambilnya sebagai informasi dan ditransformasi menjadi pengetahuan dari data-data yang kita dapatkan."
Solusinya dapat dilakukan dengan menggunakan data mining, yang dimana dari terminology data mining itu sendiri. Bahwa pengetahuan yang tadinya tidak diketahui sama sekali akhirnya diperoleh dengan proses penambangan data sehingga mendapatkan sebuah pengetahuan.
Jadi, Data Mining atau Knowledge Discovery From Data merupakan pencarian pengetahuan dari data. Â Proses ekstraksi sesuatu yang menarik (non-trivial, implicit, sesuatu yang sebelumnya tidak diketahui, dan kegunaannya berpotensi digunakan dikemudian hari).
Knowledge Discovery (KDD) Process
Secara teknis, ketika menggunakan data mining maka kita menyebut sebuah proses yang iteraktif yang dimana ada beberapa langkah proses yang dilewati. Ketika berbicara data mining, landasan paling dasar ialah database, ada yang bersifat relasional, non-relasional, SQL dan sebagainya tetapi tidak hanya satu database.Â
Jika telah memiliki data, maka kita lanjut ke Data integration, lalu ke Data Cleaning atau proses pembersihan data. Karena boleh jadi isi database ini tidak sesuai, maka dibutuhkan proses ini. Setelah data di cleaning maka selanjtnya ialah kita menaruh data yang kita miliki ke gudang data atau Data Warehouse. Selanjutnya ke proses Data Selection, memilih data dengan dasar yaitu Task-relevan data.
Tahap database tadi hingga task-relevant data, biasa disebut dengan Data Preprocessing. Kemudian masuk ke data mining, lalu Data Pattern Evaluation (proses evaluasi pola), dan selanjutnya menjadi knowledge. Dimana knowledge ini yang dipakai sebagai pendukung pengambilan keputusan.
...