Data mining adalah proses memilah-milah kumpulan data besar untuk mengidentifikasi pola dan hubungan yang dapat membantu memecahkan masalah bisnis melalui analisis data. Teknik data mining memungkinkan perusahaan untuk memprediksi tren masa depan dan membuat keputusan bisnis yang lebih tepat.
Data mining merupakan bagian penting dari analitik data secara keseluruhan dan salah satu disiplin inti dalam ilmu data, yang menggunakan teknik analitik tingkat lanjut untuk menemukan informasi yang berguna dalam kumpulan data. Data mining memiliki nama lain yaitu knowledge discovery in databases (KDD) , metodologi ilmu data untuk mengumpulkan, memproses, dan menganalisis data.
Mengapa Data mining itu penting?
Data mining adalah komponen penting dari inisiatif analitik yang sukses dalam organisasi. Informasi yang dihasilkannya dapat digunakan dalam intelijen bisnis (BI) dan aplikasi analitik lanjutan yang melibatkan analisis data historis, serta aplikasi analitik real-time yang memeriksa data streaming saat dibuat atau dikumpulkan.
Data mining yang efektif dapat membantu dalam berbagai aspek perencanaan strategi bisnis dan pengelolaan operasi. Itu termasuk fungsi yang menghadapi pelanggan seperti pemasaran, periklanan, penjualan, costumer service , manufaktur, manajemen rantai pasokan, keuangan dan SDM. Data mining juga dapat membantu di bidang keamanan seperti deteksi penipuan, manajemen risiko, perencanaan keamanan siber, dan banyak kasus penggunaan bisnis penting lainnya. Data mining tidak hanya berguna di dunia bisnis, melainkan juga memainkan peran penting dalam bidang kesehatan, pemerintahan, penelitian ilmiah, matematika, olahraga, dan masih banyak lagi.
Â
Bagaimana cara kerja Data mining ?
Proses data mining dapat dipecah menjadi empat tahap yaitu:
- Data Gathering (Pengumpulan data). Data yang relevan untuk aplikasi analitik diidentifikasi dan dikumpulkan. Data mungkin terletak di sistem sumber yang berbeda, repositori yang semakin umum di lingkungan data besar yang berisi campuran data terstruktur dan tidak terstruktur. Sumber data eksternal juga dapat digunakan. Dari mana pun data itu berasal, seorang ilmuwan data(data scientist) sering kali mengumpulkannya untuk di gunakan dalam langkah-langkah berikutnya
- Data preparation (Persiapan data). Tahap ini mencakup serangkaian langkah untuk menyiapkan data untuk ditambang. Dimulai dengan eksplorasi data, pembuatan profil, dan pra-pemrosesan, diikuti dengan pekerjaan pembersihan data untuk memperbaiki kesalahan dan masalah kualitas data lainnya. Transformasi data juga dilakukan untuk membuat kumpulan data konsisten, kecuali jika seorang ilmuwan data ingin menganalisis data mentah tanpa filter untuk alasan tertentu.
- Mining the data (Menambang data). Setelah data disiapkan, seorang ilmuwan data memilih teknik penambangan data yang sesuai dan kemudian mengimplementasikan satu atau lebih algoritma untuk melakukan mining. Dalam aplikasi machine learning , algoritma biasanya harus dilatih pada kumpulan data sampel untuk mencari informasi yang dicari sebelum dijalankan terhadap kumpulan data lengkap.
- Data analysis and interpretation (Analisis dan interpretasi data). Hasil data mining digunakan untuk membuat model analitis yang dapat membantu mendorong pengambilan keputusan dan tindakan bisnis lainnya. Ilmuwan data atau anggota lain dari tim ilmu data juga harus mengomunikasikan hasil temuannya kepada eksekutif bisnis dan pengguna, seringkali melalui visualisasi data
Jenis teknik data mining
Berbagai teknik dapat digunakan untuk melakukan data mining. Teknik data mining yang sering dikenal diantaranya sebagai berikut: