Diartikel kali ini, kita akan membahas mengenai konsep dan teknik yang dimiliki oleh data mining yaitu KDD. Sebelum membahas lebih lanjut, teman-teman yang masih bingung memahami apa itu data mining dapat melihat artikel saya di Pengenalan data mining.
Dalam mengidentifikasi sebuah data, tentu saja diperlukan teknik dan konsep didalamnya. Nah, konsep yang akan dibahas kali ini adalah KDD, agar kita bisa tau apakah data tersebut bersifat bermanfaat, memberikan pengetahuan, atau sebaliknya. Berikut penjelasannya:
KDD (Knowledge Discovery in Databases).
KDD merupakan teknik yang digunakan untuk mengidentifikasi suatu pola didalam data yang akan kita analisis melibatkan algoritma didalamnya. Adapun proses yang dimiliki KDD yaitu:
1. Data Cleansing
Data cleansing merupakan proses mengolah data. Saat kita sedang mencari sebuah data, pasti akan ada saat dimana kita mengalami data tersebut kekurangan informasi, tidak tepat, sehingga terkadang sulit untuk dicerna. Dengan data cleansing, kita dapat mengolah data dengan cara memperbaikinya, menghapus, ataupun mengubah. Data yang baik harus bersifat valid, akurat, komplit, dan konsisten. Sehingga data tersebut akan efesien dan siap digunakan.
2. Data Integration
Data Integration adalah proses menggabungkan data yang diambil dari berbagai banyak sumber. Ketika data akan di gabungkan, terlebih dahulu telah melewati proses cleansing. Data integration bertujuan untuk menghasilkan data yang efektif.
3. Data Selection
Data Selection merupakan pemilihan data dari sekumpulan data operasional perlu dilakukan sebelum tahap menggali informasi lebih dalam. Data yang telah di seleksi yang akan digunakan untuk proses data mining, disimpan secara terpisah dari basis data operasional.
4. Data Transformation
Transformation dapat kita artikan sebagai mengubah atau diganti. Jadi, Data Transformation merupakan data yang telah diubah dan sesuai kemudian diproses dalam data mining sebelum bisa diaplikasikan.
5. Data Mining
Kemudian ada proses data mining. Proses data mining merupakan proses mencari informasi yang menakjubkan atau menarik dalam data dan menggunakan teknik seperti asosiasi, klasifikasi dan lainnya.
6. Pattern Evolution
Proses ini merupakan tahap mencari pola yang mengarah pada informasi yang berguna, memudahkan dalam pengambilan keputusan, dan membuat tugas kita lebih sederhana.
7. Knowledge Presentation
Knowledge Presentasion merupakan metode cerdas mengestrak pola data penyajian pengetahuan kepada pengguna untuk visualisasi dalam bentuk pohon, tabel, grafik, bagan dan matriks.
Baca konten-konten menarik Kompasiana langsung dari smartphone kamu. Follow channel WhatsApp Kompasiana sekarang di sini: https://whatsapp.com/channel/0029VaYjYaL4Spk7WflFYJ2H