Lihat ke Halaman Asli

Mengenal Data Mining

Diperbarui: 14 September 2022   18:13

Kompasiana adalah platform blog. Konten ini menjadi tanggung jawab bloger dan tidak mewakili pandangan redaksi Kompas.

Ilmu Alam dan Teknologi. Sumber ilustrasi: PEXELS/Anthony

Data mining adalah proses mengumpulkan informasi penting dari sejumlah besar data. Proses penambangan data sering menggunakan teknik statistik dan matematika untuk memanfaatkan teknologi kecerdasan buatan. Data mining (knowledge discovery from data) adalah pencarian pengetahuan dari data.

Data mining mengacu pada proses menemukan pola menarik dalam data yang tidak valid sebagai bagian dari data. Pola yang menarik dapat digunakan untuk menceritakan sesuatu yang baru dan membuat prediksi. Istilah penambangan data dapat merujuk pada langkah-langkah di mana algoritma penambangan data digunakan. diterapkan, tetapi ini telah menyebabkan kebingungan yang cukup besar dalam literatur. Namun secara lebih umum, istilah ini digunakan untuk merujuk pada keseluruhan proses menemukan dan menggunakan pola-pola menarik dalam data, dapat dikatakan sebagai proses transformasi informasi menjadi suatu proses (KDP), juga dikenal sebagai penemuan pengetahuan basis data, mencari pengetahuan baru di beberapa domain aplikasi. Ini didefinisikan sebagai proses mengidentifikasi pola yang valid, baru, berpotensi berguna, dan pada akhirnya dapat dipahami dalam data. Ini adalah proses generalisasi ke sumber data non-database sambil menekankan database sebagai sumber data utama.

Data mining adalah bagian dari analisis data dan disiplin ilmu data yang digunakan untuk mengekstrak informasi dari kumpulan data yang ada menggunakan berbagai teknik analisis. Data mining juga dikenal dengan istilah Knowledge Discovery in Databases (KDD), knowledge extraction, data/pattern analysis, data archeology, data dredging, information harvesting, business intelligence, dan lainnya.

Tujuan Data Mining adapun tujun data mining yaitu mengumpulkan data,menyiapkan data,proses modeling,evaluasi data,penyajian data

Teknik Dalam Proses Pengambilan data

Terdapat berbagai macam teknik yang digunakan dalam proses penambangan data antara lain :

Predictive Modeling, Terdapat dua teknik yaitu Classification dan Value Prediction
Database Segmentation, Melakukan partisi database menjadi sejumlah segmen, cluster, atau record yang sama
Link analysis, Sebuah teknik untuk membuat hubungan antara record yang individu atau sekumpulan record dalam database.
Deviation detection, Sebuah teknik untuk mengidentifikasi outlier yang mengekspresikan sebuah deviasi dari ekspektasi yang sudah diketahui sebelumnya.
Nearest Neighbour, Yaitu teknik yang memprediksi pengelompokan, Teknik ini sendiri merupakan teknik yang tertua yang digunakan dalam data mining.
Clustering, merupakan teknik untuk mengklasifikasikan data berdasarkan kriteria masing-masing data. Pohon keputusan adalah teknologi generasi berikutnya, model prediktif yang dapat digambarkan sebagai pohon. Setiap node di pohon mewakili pertanyaan yang digunakan untuk mengklasifikasikan data.

Baca konten-konten menarik Kompasiana langsung dari smartphone kamu. Follow channel WhatsApp Kompasiana sekarang di sini: https://whatsapp.com/channel/0029VaYjYaL4Spk7WflFYJ2H



BERI NILAI

Bagaimana reaksi Anda tentang artikel ini?

BERI KOMENTAR

Kirim

Konten Terkait


Video Pilihan

Terpopuler

Nilai Tertinggi

Feature Article

Terbaru

Headline