Cara kerjanya sendiri secara umum adalah mengambil data kemudian diolah lalu menjadi pengetahuan baru, namun tidak sesederhana itu. Secara teori digambarkan seperti ini:
1. Konsep/Class Description adalah data dapat diasosiasikan dengan pembagian class atau konsep. Untuk contohnya, ditoko komputer A, pembagian class untuk barang yang akan dijual termasuk komputer dan printer, dan konsep untuk konsumen adalah big Spenders dan budget Spender. Hal tersebut sangat berguna untuk menggambarkan pembagian class secara individual dan konsep secara ringkas, laporan ringkas, dan juga pengaturan harga. Deskripsi suatu class atau konsep seperti itu disebut class/concept descripition.Â
2. Association Analysis adalah penemuan association rules yang menunjukkan nilai kondisi suatu attribute yang terjadi bersama-sama secara terus-menerus dalam memberikan set data. Association analysis secara luas dipakai untuk market basket atau analisa data transaksi. Biasanya digunakan untuk analisa suatu keadaan tertentu.
3. Klasifikasi/Prediksi, sesuai dengan namanya, dalam konsep prediksi ini dapat memungkinkan sebuah perusahaan barang memprediksi barang yang akan terjual atau terlaris pada tahun mendatang.
4. Cluster Analysis, tidak seperti klasifikasi dan prediksi, yang menganalisis objek data dengan kelas yang terlabeli, clustering menganalisis objek data tanpa mencari keterangan pada label kelas yang diketahui. Pada umumnya, label kelas tidak ditampilkan di dalam latihan data simply, karena mereka tidak tahu bagaimana memulainya. Clustering dapat digunakan untuk menghasilkan label-label. Â
5. Outlier Analysis dapat dideteksi menggunakan test yang bersifat statistik yang mengambil sebuah distribusi atau probabilitas model untuk data, atau menggunakan langkah-langkah jarak jauh di mana objek yang penting jauh dari cluster lainnya dianggap outlier.
6. Evolution Analysis, data analisa evolusi menggambarkan ketetapan model atau kecenderungan objek yang memiliki kebiasaan berubah setiap waktu. Meskipun ini mungkin termasuk karakteristik, diskriminasi, asosiasi, klasifikasi, atau clustering data berdasarkan waktu, kelebihan yang jelas seperti analisa termasuk analisa data time-series, urutan atau pencocockkan pola secara berkala, dan kesamaan berdasarkan analisa data.Â
(Ilmukomputer.com "Konsep Data Mining").
Baca konten-konten menarik Kompasiana langsung dari smartphone kamu. Follow channel WhatsApp Kompasiana sekarang di sini: https://whatsapp.com/channel/0029VaYjYaL4Spk7WflFYJ2H