Teknologi dan Informasi adalah suatu hal yang sudah lumrah di masyarakat. Pesatnya perkembangan teknologi dan informasi tentunya memberikan pengaruh besar masyarakat dalam kehidupannya, terutama yang berhubungan dengan data. Tidak sedikit segala sesuatu yang berkaitan dengan teknologi dan informasi tentunya selalu menggunakan data sebagai sumber informasinya. Oleh karena itu, istilah data mining menjadi salah satu tehnik atau cara untuk mengelola sebuah data sebagai sumber informasi yang bermanfaat.
Data mining adalah sebuah kegiatan untuk mengidentifikasi beragam jenis data. Dari banyaknya data yang tersimpan di database, data-data tersebut diidentifikasi baik dicari kemungkinan adanya pola ataupun lainnya yang dianggap berpotensi untuk menghasilkan sesuatu yang bisa dipakai oleh organisasi atau perusahaan yang memiliki database tersebut. Data mining itu sendiri meiliki beragam metode yang bisa digunakan yaitu KDD, CRISP-DM, SEMMA, dll . Pada artikel ini kita akan membahas KDD atau Knowledge Discovery in Database Process.
Knowledge Discovery in Database Process (KDD) adalah salah satu metode yang bisa digunakan dalam melakukan data mining. Berikut adalah ilustrasi serta penjelasan menegenai proses KDD secara detail:
- Data Cleansing, Proses dimana data diolah lalu dipilih data yang dianggap bisa dipakai.
- Data Integration, Proses menggabungkan data yang dianggap berulang akan digabungkan menjadi satu.
- Selection, Proses seleksi atau pemilihan data yang dianggap relevan terhadap analisis.
- Data Trasnformation, Proses transformasi data terpilih ke dalam bentuk mining procedure.
- Data Mining, Proses dimana dilakukan beragam teknik untuk mengekstrak pola-pola potensial menghasilkan data yang berguna.
- Pattern Evolution, Proses dimana pola-pola yang telah diidentifikasi berdasarkan measure yang diberikan.
- Knowledge Presentation, Proses paling akhir dari proses KDD, Data-data yang sudah diproses divisualisasikan agar lebih mudah dipahami oleh pengguna dan diharapkan bisa diambil Tindakan berdasarkan analisis.
Itulah gambaran serta penjelasan dari proses-proses KDD data mining. Data mining hanyalah salah satu dari beragam metode yang bisa digunakan dalam data mining. Secara umum berikut adalah tiga jenis task yang biasa dilakukan pada data mining, termasuk di dalam Knowledge Discovery in Database Process (KDD).
- Prediction. Prediksi didefinisikan sebagai sebuah tindakan untuk mencari tahu apa yang akan terjadi di masa yang akan datang. Dari data yang sudah diolah maupun yang sudah divisualisasikan, bisa saja pengguna memprediksi apa yang kemungkinan terjadi berdasarkan pola yang didapatkan.
- Association. Asosiasi adalah sebuah teknik untuk mencari hubungan dari data dari beragam variable data. Dari beragam variable data bisa saja 2 atau lebih diantaranya memiliki hubunga positif yang artinya kedua variable data ini saling berkaitan sehingga data tersebut bisa digunakan dalam data mining.
- Segmentation. Pada segmentation setiap data diklasifikan pada cluster dimana data yang memiliki karakteristik yang mirip akan dikelompokan.
referensi :
https://sis.binus.ac.id/2021/09/30/proses-data-mining-kdd/
https://www.jagoanhosting.com/blog/apa-itu-data-mining/
Follow Instagram @kompasianacom juga Tiktok @kompasiana biar nggak ketinggalan event seru komunitas dan tips dapat cuan dari Kompasiana. Baca juga cerita inspiratif langsung dari smartphone kamu dengan bergabung di WhatsApp Channel Kompasiana di SINI