Untuk setiap bisnis atau perusahaan saat ini, kemampuan untuk menggunakan informasi seefektif mungkin merupakan faktor penentu. Penggunaan informasi yang tepat yang dihasilkan dari penemuan fakta yang sangat sering tersembunyi dan belum ditemukan sebelumnya tentang perilaku transaksional konsumen, pengecer dan pemasok, tren bisnis, dan indikasi lainnya. Sederhananya, data mining berarti mengekstrak atau "menambang" informasi dari kumpulan data yang besar. Penambangan dalam hal ini bukan seperti penambangan emas atau pasir, melainkan "data mining data" atau sekedar data mining. Definisi lain dari data mining juga dapat merujuk pada penggunaan satu atau lebih teknik pembelajaran berbantuan komputer untuk mengotomatisasi analisis dan mengekstrak informasi dari data dalam database.
Data mining adalah istilah yang digunakan untuk menggambarkan menemukan informasi dari database. Penambangan data adalah proses yang menggunakan teknik statistik, matematika, kecerdasan buatan, dan pembelajaran mesin. untuk mengekstrak dan mengidentifikasi informasi yang berguna dan relevan dari beberapa basis data besar.
Data SelectionÂ
- Membuat sekumpulan data yang ditargetkan, memilih kumpulan data atau fokus pada subset variabel atau sampel data untuk membuat penemuan.
- Menyeleksi data pengumpulan data kerja harus dilakukan sebelum dimulainya tahap ekstraksi data KDD. Data yang terpilih dapat digunakan dalam proses data mining lalu disimpan dalam file terpisah dari database operasional.
- Pre-processing/ CleaningÂ
- Pemrosesan dan pembersihan data adalah operasi dasar seperti denoising
- Sebelum memulai data mining, proses pembersihan harus dilakukan pada data dalam fokus KDD.
- Proses pembersihan mencaku penghapusan data duplikat, periksa data yang bertentangan dan memperbaiki kesalahan data.
- Terjadi proses enrichment, yaitu proses "memperkaya" informasi yang ada dengan informasi atau informasi (eksternal) lain
TransformationÂ
- Menemukan fungsi yang berguna untuk menyajikan data sesuai dengan tujuan yang dicapai.
- Mengtransformasikan data yang dipilih sehingga data cocok untuk diproses pada data mining. Proses ini merupakan proses kreatif dan sangat bergantung pada database jenis atau pola data yang dicari.
Data miningÂ
- Memilih tugas dari data mining, memilih tujuan dari proses KDD, seperti klasifikasi, regresi, pengelompokan, dll.
- Memilih Algoritma Data Mining untuk Pencarian
- Data mining adalah proses mencari pola atau informasi yang menarik dari kumpulan yang dipilih dengan menggunakan teknik atau metode tertentu. Teknik, metode, atau algoritma penambangan data sangat berbeda. Memilih metode atau algoritme yang tepat sangat bergantung pada tujuan dan proses KDD secara keseluruhan.
Interpretation/ EvaluationÂ
- Terjemahan pola yang dibuat oleh penambangan data.
- Model data yang dihasilkan selama proses data mining harus disajikan kepada pihak yang berkepentingan dalam bentuk yang mudah dimengerti.
Baca konten-konten menarik Kompasiana langsung dari smartphone kamu. Follow channel WhatsApp Kompasiana sekarang di sini: https://whatsapp.com/channel/0029VaYjYaL4Spk7WflFYJ2H