Pengertian Data Mining
Data mining adalah melakukan data mining konten, memilih algoritma yang sesuai untuk penelitian data sesuai topik, dan melakukan data mining. Data mining adalah istilah yang dapat digunakan untuk menggambarkan pencarian pengetahuan dalam database. Data mining adalah proses menggunakan statistik, matematika, kecerdasan buatan dan teknik pembelajaran mesin untuk mengekstrak dan mengidentifikasi informasi yang berguna dan pengetahuan yang relevan dari daftar besar.Â
Knowledge Discovery Process and Data Mining
Knowledge Discovery in Databases (KDD) adalah ekstraksi non sepele dari pengetahuan implisit, yang sebelumnya tidak diketahui dan berpotensi berguna dari data. Penambangan data adalah eksplorasi dan analisis data dalam jumlah besar secara berurutan untuk menemukan valid, baru, berpotensi berguna, dan pada akhirnya dapat dimengertipola dalam data. Proses semi-otomatis menganalisis database besar untuk temukan pola yang:
- Valid: Pola-pola yang berlaku secara umum.
- Novel: Kami tidak tahu polanya sebelumnya.
- Berguna: Kita dapat merancang tindakan dari pola.
-- Dapat dimengerti: Kita dapat menafsirkan dan memahami pola-polanya.
Data mining tidak pernah dihilangkan dari istilah data, dengan alasan bahwa dalam pengolahan data mining diperlukan kumpulan data untuk memperoleh pengetahuan.
Dalam terminologi aritmatika , dataset adalah kumpulan objek yang berisi properti tertentu atau variabel, di mana untuk objek adalah data individu yang memiliki atribut atau variabel tersebut.
Jenis - Jenis Dataset
jenis dataset terbagi atas tiga jenis , yaitu sebagai berikut :
1. Record Data merupakan data yang terdiri dari sekumpulan record, yang masing - masing record terditri dari satu set atribut tetap.
2. Data Graph adalah data yang mempunyai bentuk grafik yang terdiri dari sejumlah node dan edge.
3. Ordered Data Merupakan data - data yang memperhatikan urutan nilai - nilainya. Yang termaksud dalam data urut merupakan genomic sequence data atau spatio-temporal data.
Jenis - Jenis Atribut
1. Atribut Nominal
2. Â Atribut Ordinal
3. Atribut Interval atau jarak
4. Atribut Rasio (Mutlak)
Proses Data Mining
Memilih algoritme yang tepat dan yang tepat akan bergantung pada proses penemuan pengetahuan dalam kumpulan data secara keseluruhan.
Himpunan Data (Pemahaman dan Pengolahan Data)
1. Data Cleaning
Pembersihan data adalah pemrosesan data untuk menangani data yang memiliki nilai yang hilang dalam catatan dan menghilangkan kebisingan.
2. Data Integration
Integrasi data adalah penggabungan data basis data ke dalam basis data baru.
Integrasi yang baik data akan menghasilkan data gabungan dengan sedikit redundansi/atau inkonsistensi, sehingga meningkatkan akurasi dan kecepatan proses data mining.
3. Data Transformation
Misalnya, beberapa metode standar seperti hanya analisis asosiasi pengelompokan hanya dapat menerima input kategorikal.
Analisis klasifikasi dan asosiasi tidak dapat menerima numerik kontinu, sehingga harus dipecah menjadi beberapaProses ini sering disebut transformasi data. Dalam kasus yang diterapkan ke kumpulan data penyakit ginjal kronis, langkah transformasi data memerlukan kumpulan data untuk didiskritisasi menggunakan .
Teknik Data Mining
1. Klasifikasi
2.Klasterisasi
3. Association Rule
4. Regression
Pengetahuan
Pengetahuan dari data mining adalah mengetahui bagaimana mengelola pengambilan keputusan tertentu atau tindakan selanjutnya yang akan dilakukan sesuai dengan hasil analisis yang diperoleh.
Proses pemberian informasi dari pengolahan data mining terkadang diperlukan untuk orang yang tidak mengerti data mining.
Evaluasi
Evaluasi model adalah proses untuk mengidentifikasi model untuk dimasukkan ke dalam basis pengetahuan yang ditemukan.
Evaluasi adalah proses mengevaluasi model yang menarik atau model prediksi, apakah mereka memenuhi hipotesis awal atau tidak.Â
Baca konten-konten menarik Kompasiana langsung dari smartphone kamu. Follow channel WhatsApp Kompasiana sekarang di sini: https://whatsapp.com/channel/0029VaYjYaL4Spk7WflFYJ2H