Pada artikel ini, kita membahas peran utama dari data mining. Data mining memiliki banyak teknik dan algoritma data mining yang dapat dipilih dan disesuaikan dengan tujuan mining dan tipe karakter datanya. Semuanya memiliki fungsi dan tujuan yang berbeda-beda tergantung kebutuhannya.
Kebutuhan atau pentingnya bidang data mining tidak lepas dari tujuan dan peran data mining itu sendiri. Tujuan dari data mining secara umum adalah:
- Prediction
Tujuannya adalah untuk memprediksi atau memperkirakan nilai beberapa atribut berdasarkan nilai atribut lainnya. Atribut yang diprediksi biasanya dikenal sebagai variabel target atau dependen, sedangkan atribut yang digunakan untuk membuat prediksi dikenal sebagai variabel penjelas atau independen.
- Description
Tujuannya adalah untuk mendapatkan pola (korelasi, tren, cluster, lintasan dan anomali) yang merangkum hubungan yang paling penting dalam data. Tugas data mining deskriptif sering kali bersifat eksploratif dan seringkali memerlukan teknik pasca-pemrosesan untuk mengonfirmasi dan mengklarifikasi hasilnya.
- Estimation
Teknik untuk mengevaluasi data baru di mana keputusan belum dibuat berdasarkan riwayat data yang ada, di mana variabel target untuk evaluasi adalah numerik daripada kategorik. Model dibangun menggunakan record lengkap yang memberikan nilai variabel target sebagai nilai prediksi. Selain itu, pada revisi selanjutnya dibuat estimasi nilai variabel target berdasarkan nilai variabel prediktor.
- Clasification
Sebuah teknik yang mempelajari perilaku dan karakteristik kelompok tertentu. Metode ini dapat mengklasifikasikan data baru dengan mengolah data terklasifikasi yang ada dan menggunakan hasilnya untuk menghasilkan beberapa aturan. Salah satu contoh sederhana dan populer adalah pohon keputusan, yang merupakan salah satu teknik klasifikasi yang paling populer karena mudah diinterpretasikan, seperti algoritma C4.5, ID3, dll.
- Association
Teknik untuk mengidentifikasi perilaku peristiwa atau proses tertentu di mana hubungan asosiatif ditetapkan untuk setiap peristiwa. Teknik yang umum digunakan untuk menyelesaikan masalah adalah algoritma Apriori.
- Clustering
Teknik untuk mengelompokkan data dan membentuk kelas dari objek yang sejenis. Cluster adalah kumpulan record yang memiliki kesamaan satu sama lain dan perbedaan dengan record di cluster lain. Proses clustering berbeda dengan proses klasifikasi karena tidak ada variabel target untuk clustering. Proses clustering mencoba membagi semua data ke dalam kelompok-kelompok yang memiliki kesamaan (homogen), dimana kesamaan data satu kelompok tinggi (maksimum) dan kesamaan data dengan data kelompok lain rendah (minimum).
Baca konten-konten menarik Kompasiana langsung dari smartphone kamu. Follow channel WhatsApp Kompasiana sekarang di sini: https://whatsapp.com/channel/0029VaYjYaL4Spk7WflFYJ2H