Lihat ke Halaman Asli

Mendalami Proses KDD (Knowledge Discovery in Databases) Data Mining

Diperbarui: 20 September 2022   13:41

Kompasiana adalah platform blog. Konten ini menjadi tanggung jawab bloger dan tidak mewakili pandangan redaksi Kompas.

Ilmu Alam dan Teknologi. Sumber ilustrasi: PEXELS/Anthony

Berbagai macam kegiatan dilakukan masing-masing orang, mulai dari bertransaksi hingga menghibur diri, semuanya bisa dilakukan melalui aplikasi dan akses internet.

Hal tersebut meninggalkan jejak digital yang tersimpan melalu platform yang mempunyai kapasistas yang besar. Kebiasaan pengguna dapat diketahui melalu proses yang dinamakan data mining atau penggalian data. Tapi kali ini saya tidak akan membahas penjelasan mengenai pengertian data mining secara spesifik hanya saja saya akan menjelaskan mengenai salah satu proses yang terdapat dalam data mining yaitu KDD atau Knowledge discovery in databases.

Data mining adalah sebuah kegiatan untuk mengidentifikasi beragam jenis data. Dari banyaknya data yang tersimpan di database, data-data tersebut diidentifikasi baik dicari kemungkinan adanya pola ataupun lainnya yang dianggap berpotensi untuk menghasilkan sesuatu yang bisa dipakai oleh organisasi atau perusahaan yang memiliki database tersebut.

Data mining itu sendiri meiliki beragam metode yang bisa digunakan yaitu KDD, CRISP-DM, SEMMA, dll. Setiap proses memiliki metode yang berbeda-beda dalam pencarian informasi penting yang ada di dalam database orgnisasi. Pada artikel ini kita akan membahas KDD atau Knowledge Discovery in Database Process.

Knowledge Discovery in Database Process (KDD) adalah salah satu metode yang bisa digunakan dalam melakukan data mining. Fayyed et al. (1996) mendefinisikan KDD sebagai proses dari menggunakan metode data mining untuk mencari informasi-informasi yang berharga, pola yang ada di dalam data, yang melibatkan algoritma untuk mengidentifikasi pola pada data. 

Dunham (2003) meringkas proses KDD dari berbagai step, yaitu: seleksi data, pra-proses data, transformasi data, data mining, dan yang terakhir interpretasi dan evaluasi. Berikut adalah ilustrasi serta penjelasan menegenai proses KDD secara detail:

  1. Data Cleansing, Proses dimana data diolah lalu dipilih data yang dianggap bisa dipakai.
  2. Data Integration, Proses menggabungkan data yang dianggap berulang akan digabungkan menjadi satu.
  3. Selection, Proses seleksi atau pemilihan data yang dianggap relevan terhadap analisis.
  4. Data Trasnformation, Proses transformasi data terpilih ke dalam bentuk mining procedure.
  5. Data Mining, Proses dimana dilakukan beragam teknik untuk mengekstrak pola-pola potensial menghasilkan data yang berguna.
  6. Pattern Evolution, Proses dimana pola-pola yang telah diidentifikasi berdasarkan measure yang diberikan.
  7. Knowledge Presentation, Proses paling akhir dari proses KDD, Data-data yang sudah diproses divisualisasikan agar lebih mudah dipahami oleh pengguna dan diharapkan bisa diambil Tindakan berdasarkan analisis.

Tahapan proses KDD

- Pembelajaran domain aplikasi

-Integrasi data

-Pembersihan dan preprocessing data

-Meruduksi dan memproyeksi data(temukan fitur yang berguna,reduksi dimensi/variabel)

Halaman Selanjutnya


BERI NILAI

Bagaimana reaksi Anda tentang artikel ini?

BERI KOMENTAR

Kirim

Konten Terkait


Video Pilihan

Terpopuler

Nilai Tertinggi

Feature Article

Terbaru

Headline