Tahapan  proses Knowledge Discovery in Databases data mining
Knowledge discovery in databases (KDD) merupakan sekumpulan Proses data mining akan mencari sebuah pola, menggali , menganalisis beberapa besar himpunan, mengekstrak data serta pengetahuan yang bermanfaat.Â
Tahapan Proses Data mining sebagai berikut :Â
1. Data CleaningÂ
Data cleaning adalah pembersihan data dan tentunya suatu prosedur untuk memastikan kebenaran dan konsistensi terhadap data. Tahapan ini merupakan proses awal untuk membuat data yang siap diolah.
2. Data Integration.
Data Intergration adalah datanya terdapat dari beberapa sumber sturuktur data berbeda. Maka perlu kita lakukan tahap integrasi data untuk nengkobinasikan data-data yang ada.
3. Data Selection
Ketika data kita sudah dicleaning dan integration maka selanjutnya adalah tahap data selection yang dimana untuk menyeleksi data terhadap data yang relevan untuk dianalisa dan mencari data yang berelasi dengan objek.
4. Data Transformation
Data transformation adalah merubah skala data kedalam bentuk lain sehingga data memiliki d istribusi yang diharapkan. Misalkan transformasi data kuantitatif ke kualitatif.
5. Data Mining
Ketika sudah ditransformasikan datanya maka tahap selanjutnya data mining. Tahap ini paling esensial yang dilakukan pada data mining. Tahap ini akan diterapkan dengan metodealgoritma yang menjadi kunci dari proses data mining.\
Metode Data MiningÂ
a. Classification adalah metode untuk memprediksi kelas suatu objek
b. Clustering digunakan dalam membagi kumpulan data menjadi beberapa kelompok berdasarkan kemiripan atribut yang dimiliki.
c. Asosiation adalah mencari keterkaitan 2 buah item (ada relasi) dalam sebuah kelompok data
6. Pattern Evaluation
Tahap ini merupakan evaluasi pola yang ditemukan akan dilakukan evaluasi untuk melihat tingkat keberhasilan, yang dimana mendekati 100 % ataupun dibatasi interval tertentu untuk melihat data mining ini.Â
7. KnowledgeÂ
Tahap ini perlu dideskripsikan / narasikan apa yang kita peroleh dari data yang akan diserahkan kepada pengguna kita. Tahap ini adalah proses paling akhir dari proses data mining, data-data yang sudah divisualisasikan agar lebih mudah dipahami oleh pengguna.
Itulah rangkuman dari proses Knowledge Discovery in Databases.Â
Tujuan dari proses ini yaitu untuk mecari potensi dari data yang diambil dari database yang akan dipelajari melalui pola dan dianalisa serta divisualisasikan agar mudah dipahami oleh pengguna.Â
Baca konten-konten menarik Kompasiana langsung dari smartphone kamu. Follow channel WhatsApp Kompasiana sekarang di sini: https://whatsapp.com/channel/0029VaYjYaL4Spk7WflFYJ2H