Lihat ke Halaman Asli

Hafidz Abdillah Sam Mongkito

mahasiswa program studi ilmu komputer

Data Mining (Part 2)

Diperbarui: 22 September 2022   07:30

Kompasiana adalah platform blog. Konten ini menjadi tanggung jawab bloger dan tidak mewakili pandangan redaksi Kompas.

Ilmu Alam dan Teknologi. Sumber ilustrasi: PEXELS/Anthony

Pemaparan ringkasan materi dalam perkuliahan data mining pada 15 September 2022 :

Data Mining merupakan gambaran suatu proses pencarian data yang akan diolah menjadi sebuah informasi sebagai dasar dari sebuah pengetahuan (knowledge) yang didapatkan dari suatu proses kumpulan data yang besar.

Data Mining mempunyai beberapa metode diantaranya sebagai berikut :

  • Deskripsi (description) : suatu proses untuk memahami lebih jauh tentang data yang akan diamati . maksudnya pada proses ini data mining dapat digunakan untuk menggali hasil penelitian yang melibatkan data yang sangat besar untuk dijasika suatu rangkuman atau ringkasan  temuan fakta - fakta yang belum pernah diketahui secara spesifik (menjadi sebuah pengetahuan / knowledge).
  • Prediksi (prediction) : merupakan sebuah fungsi  bagaimana sebuah proses nantinya akan menemukan pola-pola tertentu dari sebuah data. kemudian pola pola tersebut dapat diketahui dari berbagai variabel - variabel yang ada pada data.
  • Klasifikasi (classification) : merupakan sudatu proses untuk menemukan definisi kemiripan / kesamaan karakteristik dalam sebuah kumpulan data , kemudian kumpulan data yang telah diklasifikasi ini dapat digunakan sebagai suatu pengetahuan deskripsi informasi yang dapat menjadi dasar / teori dalam menyelesaikan sebuah problem dimasa mendatang.
  • Asosiasi (association) : suatu proses untuk menemukan atribut yang muncul dalam satu waktu kemudian menciptakan suatu ikatan
  •  (clustering) hampir mirip dengan classification, namun memerlukan label atau grup data yang lebih banyak berdasarkan pola kesamaan

Beberapa tahapan dalam data mining yang dibahas pada pertemuan 15 September sebagai berikut :

  • Selection : Pemilihan (seleksi) data dari sekumpulan data operasional perlu dilakukan sebelum tahap penggalian informasi dalam KDD dimulai. 
  • Data Cleaning : merupakan suatu prosedur untuk memastikan kebenaran, konsistensi, dan kegunaan suatu data yang ada dalam data set. contohnya cara kerjanya yaitu dengan mendeteksi adanya error atau corrpt pada data, kemudian memperbaiki atau menghapus data jika memang diperlukan
  • Data Integration : suatu sistem yang mengizinkan user mengakses data dari berbagai sumber dalam satu sistem terpusat sehingga menghasilkan data data yang selaras

Selanjutnya dari kedua proses sebelumnya menghasilkan atau membentuk Data warehouse . Data warehouse : sistem yang didalamnya menampung kumpulan data dari berbagai sumber untuk diolah dalam tahapan  untuk  proses data mining yang efektif

  • Transformation : suatu proses untuk mengubah skala data dalam bentuk lain sehingga data memiliki distribusi yang diharapkan, maksudnya disini mengubah skala data ke bentuk yang sesuai dengan keperluan kita dalam suatu proses data mining
  • Data mining : pada tahapan ini dapat diartikan sebagai proses penambangan data terjadi, serta pada tahapan ini yang harus diperhatikan adalah metode yang digunakan agar menghasilkan hasil yang sesuai dengan keinginan.
  • Pattern Evaluation : Merupakan proses mengidentifikasi apakah pola atau informasi yang ditemukan sesuai fakta atau hipotesa yang ada sebelumnya. Luaran yang diperoleh berupa data-data outlier menggunakan algoritma Local Correlation Integral dan akan diuji kebenarannya oleh pemilik data apakah hipotesa outlier yang mereka miliki sama dengan hasil yang diperoleh sistem.
  •  Knowledge Presentation : proses merepresentasikan pola kepada pengguna ke dalam bentuk yang mudah dimengerti.

Dari beberapa pemaparan rangkuman materi perkuliahan diatas  saya mendapat pemahaman bahwa salah satu tujuan data mining yaitu untuk menghasilkan / mempresentasikan suatu informasi pengetahuan kepada pengguna dalam bentuk yang mudah dimengerti yang sebelumnya telah melalui tahapan tahapan / pola pola seleksi data.

Sekian dan terima kasih ......

Follow Instagram @kompasianacom juga Tiktok @kompasiana biar nggak ketinggalan event seru komunitas dan tips dapat cuan dari Kompasiana
Baca juga cerita inspiratif langsung dari smartphone kamu dengan bergabung di WhatsApp Channel Kompasiana di SINI




BERI NILAI

Bagaimana reaksi Anda tentang artikel ini?

BERI KOMENTAR

Kirim

Konten Terkait


Video Pilihan

Terpopuler

Nilai Tertinggi

Feature Article

Terbaru

Headline