Data Mining merupakan sebuah pengetahuan atau ekstraksi pola yang menarik di mana sebelumnya tidak diketahui, berpotensi berguna, pernyataan teori yang tidak mudah untuk dibuktikan (non-trivial), dan makna yang tersirat (implisit).
Knowlegde discovery in Database (KDD) merupakan sebuah ekstraksi pengetahuan, intelijen bisnis, analisis data/pola, arkeologi data, pengumpulan data, dan penggalian/pencarian data, dll.
Knowlegde discovery Process memiliki beberapa tahapan antara lain yaitu :
1. Data Integration : proses menyatukan atau menggabungkan antara dua atau lebih data dari database yang sumbernya berbeda-beda ke dalam sebuah penyimpanan atau yang disebut dengan Data Warehouse (Gudang data).
2. Data Cleaning : proses pemeriksaan Kembali untuk memastikan apakah data tersebut terdektesi error atau corrupt yang kemudian akan diperbaiki atau dihapus data yang tidak digunakan. Setelah data digabunggkan lalu di simpan ke dalam Data Warehouse dan sudah melalui proses Data Cleaning maka selanjutnya data akan diseleksi.
3. Data Selection : proses mengidentifikasi pada semua sumber data yang relevan dan memilih Sebagian data yang akan diperlukan saja menggunakan analysis task. sehingga terbentuklah data yang disebut dengan Task-Relevant Data.
4. Data Tranformation : proses transformasi dari data relevan menjadi data mining.
5. Data Mining : proses untuk mengekstrak pola yang menarik pada data yang relevan sebelum dikirim ke Patterns Evaluation dengan menerapkan intelligent methods.
6. Patterns Evaluation : proses evaluasi pola yang betul-betul menarik dan akan menjadi sebuah pengetahuan yang berdasarkan banyaknya jumlah ketertarikan.
7. Knowlage Presentation : merupakan proses akhir yang mana data telah melalui enam proses KDD selanjutkan akan ditampilkan atau dipublikasikan kepada pengguna.
- Atribut pada data mining
Atribut merupakan bagian dari data atau properti yang dapat mewakili sebuah karakteristik dari objek data. Adapun jenis-jenis atribut pada data mining yaitu :
Nominal : merupakan atribut yang mengenali sebuah perbedaan sifat, yang memiliki tujuan untuk membedakan antara nilai yang satu dengan yang lainnya.
Binary : merupakan atribut nominal yang hanya dua kategori atau menyatakan (0) dan (1) dimana (0) itu salah/kosong sementara (1) itu benar/ada.
Ordinal : merupakan atribut yang mengkategorikan infromasi tentang suatu tahapan yang dapat dijadikan sebuah pembeda.
Numeric : merupakan atribut yang dapat diukur (kuantitatif) dengan tipe integer yang biasa digunakan. Pada atribut ini memiliki 2 jenis yaitu Interval dan Ratio.
Baca konten-konten menarik Kompasiana langsung dari smartphone kamu. Follow channel WhatsApp Kompasiana sekarang di sini: https://whatsapp.com/channel/0029VaYjYaL4Spk7WflFYJ2H