Mungkin masih banyak diantara kalian yang tidak mengerti apa itu Data Mining atau bahkan tidak sedikit diantara kalian yang mengalami miskonsepsi tentang Data Mining itu sendiri. Sering sekali Data Mining ini diterjemahkan sebagai Penggalian Data, namun hal ini kurang tepat karena "Mining" disini memiliki arti yang seharusnya diterjemahkan menjadi Penambangan atau proses mengekstrak dan bukan Penggalian.Â
Lalu bagaimana dengan data ? Data sendiri memiliki arti yaitu catatan atas sekumpulan fakta dan dapat memberikan sebuah gambaran terhadap sesuatu. Jadi secara singkat makna dari Data Mining adalah kegiatan mengekstrak yang meliputi pengumpulan, pemakaian data historis untuk menemukan keteraturan, pola dan hubungan dalam set data berukuran besar.
Masalah umum Data Mining
1.Skalabilitas, penyimpanan dari data biasanya memakan kapasitas yang besar, singkatnya semakin banyak data yang disimpan maka akan semakin besar juga kapasitas yang diperlukan.
2.Ketidaktersedianya data atau akses terhadap data yang sulit, anggap saja kalian mau mencari suatu data rahasia yang hanya dipegang oleh agen-agen CIA atau bahkan MI6 seperti yang ada di film James Bond, tentu sulit bukan?
3.Kualitas data yang kurang baik, apabila kalian disuruh untuk melakukan "Mining" terhadap suatu hal dan harus disediakan dalam bentuk video HD atau 720p, namun sayangnya data yang kalian dapat merupakan video yang kualitas nya seperti gambar pada perang dunia ke 2.
4. Biaya yang mahal sampai ke perawatannya, bayangkan kalian disuruh mencari data dan harus menyimpannya tetapi data tersebut memiliki ukuran sampai 100 Terabyte! Tentu nya dibutuhkan Hard disk yang kapasitas penyimpanan nya sangat besar.
5. Data yang heterogen & kompleks, contoh kumpulan hal web yg terdiri atas teks yg semi terstruktur dan banyak terdapat link. Teknik data mining harus mempunyai teknik otokorelasi spasial dan waktu, graph connectivity & keterhubungan parent-child antara elemen teks semi terstruktur & dokumen XML
Implementasi Data Mining