Dewasa ini, teknologi kian menggila. 'Gila' dalam arti hal yang menakjubkan dan belum ada. Banyak ilmu-ilmu baru terutama dalam bidang IT. Dunia menjadi serba-serbi digital. Bahkan, jika melihat periode waktu dalam 5-7 tahun terakhir, teknologi berkembang sangat cepat. Semakin beriringnya waktu, teknologi semakin canggih.Â
Saat ini, terdapat ilmu baru yang cukup populer, sebenarnya bukan ilmu baru, melainkan definisi baru untuk pemanfaatan banyak disiplin imu, yaitu Data Mining. Konsep Data Mining terlihat seperti kombinasi dari beberapa bidang ilmu seperti matematika, statistika, artificial intelligence, machine learning, information system dan database.Â
Apa sebenarnya yang dimaksud dengan Data Mining?Â
Data mining adalah istilah yang digunakan untuk menjelaskan proses pencarian atau penambangan knowledge dari data yang sangat besar (Big Data).Â
Menurut analogi, orang mungkin berpikir bahwa istilah data mining adalah sesuatu yang tidak tepat; menambang emas dari bebatuan atau lumpur diacu sebagai  'penambangan emas' dan bukannya penambangan 'batu' atau 'lumpur'. Jadi, data mining barangkali lebih cocok diberi nama 'knowledge mining' atau 'knowledge discovery'.
Meskipun ada ketidakcocokan antara makna dan istilah, data mining telah menjadi pilihan bagi komunitas ilmu ini. Banyak nama-nama lain yang ter-asosiasi dengan data mining antara lain 'knowledge extraction', 'pattern analysis', 'data archaeology', 'information harvesting', 'pattern searching', dan 'data dredging'. (Binus.ac.id: Definisi, Karakteristik, dan Manfaat Data Mining -Seri Data Mining for Business Intelligence (2) ).
Jika dianalogikan kembali, konsep ini seperti sebuah pencarian sesuatu untuk mencapai tujuan tertentu dari data-data besar yang mungkin selama ini tidak digunakan. Contoh saja perusahaan ritel berdiri sejak 2001, data transaksi dari mulai berdiri hingga saat ini bukan lagi data yang kecil, dari sekian banyak data terdapat sebuah informasi dan pengetahuan yang diambil atau disimpulkan dari data tersebut.
Misalkan, kita bisa tau barang apa saja yang dibeli pada bulan Ramadhan dengan melihat data transaksi, dari situ muncul pengetahuan mengenai produk terlaris yang terjual di bulan Ramadhan, dsb.Â
Mengapa Data Mining ini menjadi penting?Â
Karena semakin tahun, perusahaan semakin bersaing. Tersedianya data dalam jumlah yang besar dan juga besarnya kebutuhan untuk mengubah data menjadi informasi dan pengetahuan yang berguna.Â
Bagaimana cara kerja Data Mining? Apakah terdapat jenis dalam konsep ini?
Cara kerjanya sendiri secara umum adalah mengambil data kemudian diolah lalu menjadi pengetahuan baru, namun tidak sesederhana itu. Secara teori digambarkan seperti ini:
1. Konsep/Class Description adalah data dapat diasosiasikan dengan pembagian class atau konsep. Untuk contohnya, ditoko komputer A, pembagian class untuk barang yang akan dijual termasuk komputer dan printer, dan konsep untuk konsumen adalah big Spenders dan budget Spender. Hal tersebut sangat berguna untuk menggambarkan pembagian class secara individual dan konsep secara ringkas, laporan ringkas, dan juga pengaturan harga. Deskripsi suatu class atau konsep seperti itu disebut class/concept descripition.Â
2. Association Analysis adalah penemuan association rules yang menunjukkan nilai kondisi suatu attribute yang terjadi bersama-sama secara terus-menerus dalam memberikan set data. Association analysis secara luas dipakai untuk market basket atau analisa data transaksi. Biasanya digunakan untuk analisa suatu keadaan tertentu.
3. Klasifikasi/Prediksi, sesuai dengan namanya, dalam konsep prediksi ini dapat memungkinkan sebuah perusahaan barang memprediksi barang yang akan terjual atau terlaris pada tahun mendatang.
4. Cluster Analysis, tidak seperti klasifikasi dan prediksi, yang menganalisis objek data dengan kelas yang terlabeli, clustering menganalisis objek data tanpa mencari keterangan pada label kelas yang diketahui. Pada umumnya, label kelas tidak ditampilkan di dalam latihan data simply, karena mereka tidak tahu bagaimana memulainya. Clustering dapat digunakan untuk menghasilkan label-label. Â
5. Outlier Analysis dapat dideteksi menggunakan test yang bersifat statistik yang mengambil sebuah distribusi atau probabilitas model untuk data, atau menggunakan langkah-langkah jarak jauh di mana objek yang penting jauh dari cluster lainnya dianggap outlier.
6. Evolution Analysis, data analisa evolusi menggambarkan ketetapan model atau kecenderungan objek yang memiliki kebiasaan berubah setiap waktu. Meskipun ini mungkin termasuk karakteristik, diskriminasi, asosiasi, klasifikasi, atau clustering data berdasarkan waktu, kelebihan yang jelas seperti analisa termasuk analisa data time-series, urutan atau pencocockkan pola secara berkala, dan kesamaan berdasarkan analisa data.Â
(Ilmukomputer.com "Konsep Data Mining").
Baca konten-konten menarik Kompasiana langsung dari smartphone kamu. Follow channel WhatsApp Kompasiana sekarang di sini: https://whatsapp.com/channel/0029VaYjYaL4Spk7WflFYJ2H