Sebelumnya kita telah melakukan pembahasan tentang pengenalan data mining dan tahapan proses pada data mining. Nah selanjutnya untuk lebih meningkatkan pemahaman kita mengenai data mining, kali ini kita akan membahas peran utama pada data mining dan metode-metode yang digunakan beserta contoh penerapannya dalam kehidupan sehari-hari. Jadi, sebelum lanjut silahkan cek materi sebelumnya di link berikut jika belum:
Tahapan Proses Data Mining/Knowledge Discovery (KDD)
Â
Perlu kita ingat, singkatnya data mining adalah disiplin ilmu yang mempelajari metode untuk mengekstrak pengetahuan atau menemmukan pola dari data yang besar. Konsep dasar data mining secara sederhana dapat digambarkan sebagai berikut.
Himpuninan data => metode data mining => pengetahuan
Contoh : Himpunan data dari pulahn ribu mahasiswa, seperti nim, nama, gender, nilai, waktu lulus yang kemudian diolah dengan metode/algoritma klasifikasi decision tree hingga diperolehlah pengetahuan untuk memprediksi kelulusan mahasiswa.
Himpunan data yang kita miliki dalam data mining disebut dengan data set yang terdiri dari dari baris (record/object/sample/tuple/data) dan kolom (atribut/feature/dimension). Ada satu atribut yang ditetapkan sebagai class/label/target yang akan menjadi data utama untuk diprediksi. Kemudian ada juga yang disebut dengan tipe data, pada data mining awalnya itu dibagi dua dengan data yang bisa dihitung/tambah kurang bagi (numerik) dan tidak bisa dihitung/tambah kurang bagi (nominal).
Hubungan Data Mining dan Bidang Lain
- Pattern Recognition, pada data mining kita harus memahami pola
- Statistics, pada data mining nantinya kita akan ketemu dengan data statistik
- Computing Algorthms, metode pada data mining berhubungan dengan algortima komputasi
- Database Technology, pada data mining himpunan data berhubungan dengan database teknologi
- Machine Learning, sistem data mining berhubungan dengan machine learning atau kecerdasan buatan seperti manusia yang belajar dari pengalaman atau banyak data yang dimiliki.
Â