Diartikel kali ini, kita akan membahas mengenai konsep dan teknik yang dimiliki oleh  data mining yaitu KDD. Sebelum membahas lebih lanjut, teman-teman yang masih bingung memahami apa itu data mining dapat melihat artikel saya di Pengenalan data mining.
Dalam mengidentifikasi sebuah data, tentu saja diperlukan teknik dan konsep didalamnya. Nah, konsep yang akan dibahas kali ini adalah KDD, agar kita bisa tau apakah data tersebut bersifat bermanfaat, memberikan pengetahuan, atau sebaliknya. Berikut penjelasannya:
KDD (Knowledge Discovery  in Databases).
KDD merupakan teknik yang digunakan untuk mengidentifikasi suatu pola didalam data yang akan kita analisis melibatkan algoritma didalamnya. Adapun proses yang dimiliki KDD yaitu:
   1. Data Cleansing
    Data cleansing merupakan proses mengolah data. Saat kita sedang mencari sebuah data, pasti akan ada saat dimana kita  mengalami  data tersebut kekurangan informasi, tidak tepat, sehingga terkadang sulit untuk dicerna. Dengan data cleansing, kita  dapat mengolah data dengan cara memperbaikinya, menghapus, ataupun mengubah. Data yang baik harus bersifat valid, akurat,  komplit, dan konsisten. Sehingga data tersebut akan efesien dan siap digunakan.Â
 2. Data Integration
      Data Integration adalah proses menggabungkan data yang diambil dari berbagai banyak sumber. Ketika data akan di gabungkan,      terlebih dahulu telah melewati proses cleansing. Data integration bertujuan untuk menghasilkan data yang efektif.
   3. Data Selection
      Data Selection merupakan pemilihan data dari sekumpulan data operasional perlu dilakukan sebelum tahap menggali informasi      lebih dalam. Data yang telah di seleksi yang akan digunakan untuk proses data mining, disimpan secara terpisah dari basis data         operasional.
  4. Data Transformation
      Transformation dapat kita artikan sebagai mengubah atau diganti. Jadi, Data Transformation merupakan data yang telah  diubah       dan sesuai kemudian diproses dalam data mining sebelum bisa diaplikasikan.Â
   5. Data Mining
      Kemudian ada proses data mining. Proses data mining merupakan proses mencari informasi yang menakjubkan atau menarik       dalam data dan menggunakan teknik seperti asosiasi, klasifikasi dan lainnya.
   6. Pattern Evolution
       Proses ini merupakan tahap mencari pola yang mengarah pada informasi yang berguna, memudahkan dalam pengambilan         keputusan, dan membuat tugas kita lebih sederhana.
   7. Knowledge PresentationÂ
       Knowledge Presentasion merupakan metode cerdas mengestrak pola data penyajian pengetahuan kepada pengguna untuk visualisasi dalam bentuk pohon, tabel, grafik, bagan dan matriks.Â
Â
Baca konten-konten menarik Kompasiana langsung dari smartphone kamu. Follow channel WhatsApp Kompasiana sekarang di sini: https://whatsapp.com/channel/0029VaYjYaL4Spk7WflFYJ2H