Mohon tunggu...
Yunda Puji Lestari
Yunda Puji Lestari Mohon Tunggu... Freelancer - Mahasiswi IT

Work, work and work

Selanjutnya

Tutup

Ilmu Alam & Tekno

Peran Utama & Metode Dalam Data Mining

20 Oktober 2022   14:36 Diperbarui: 20 Oktober 2022   14:43 669
+
Laporkan Konten
Laporkan Akun
Kompasiana adalah platform blog. Konten ini menjadi tanggung jawab bloger dan tidak mewakili pandangan redaksi Kompas.
Lihat foto
Level Pengolahan Data (Source : 1 Hour Online Training: Data Mining - YouTube)

Dewasa ini, kehidupan masyarakat berkaitan banyak dengan data baik itu menghasilkan data dengan rasio yang sangat besar ataupun menerima data dari pihak ketiga dengan perantara media sosial. 

Pengguna Media Sosial & Internet Indonesia 2022 (Source : https://gaungmedia.com/2022/07/26/pengguna-sosial-media-dan-internet-indonesia-2022/)
Pengguna Media Sosial & Internet Indonesia 2022 (Source : https://gaungmedia.com/2022/07/26/pengguna-sosial-media-dan-internet-indonesia-2022/)

Banyaknya data yang dihasilkan menimbulkan fenomena "tsunami data" yang diartikan sebagai lonjakan pengetahuan digital. Data-data dalam fenomena ini sendiri terbagi menjadi data-data yang bermanfaat yang dapat menunjang perkembangan teknologi dan juga sebaliknya yaitu data yang tidak bermanfaat. Menurut John Naisbitt dalam bukunya yang berjudul Megatrends yang diterbitkan pada tahun 1988, beliau menyebutkan "We are drowning in data, but starving for knowledge!". Kutipan tersebut sangat menggambarkan kehidupan sekarang, dimana masyarakat "tenggelam" oleh data tetapi pengetahuan yang dihasilkan/didapatkan minim karena data yang diperoleh tidak di olah menjadi pengetahuan yang dapat di ambil. Seperti dalam tulisan saya sebelumnya, data dapat diolah menjadi informasi kemudian informasi yang diolah akan menghasilkan pengetahuan atau singkatnya  data -> informasi -> pengetahuan dimana semakin tinggi tingkatan pengolahannya semakin tinggi pula valuenya. Data memiliki value yang lebih rendah jika dibandingkan dengan informasi dan informasi memiliki value yang lebih rendah jika dibandingkan dengan pengetahuan. Kenapa value yang dihasilkan oleh pengetahuan lebih tinggi? hal ini dikarenakan pola yang dihasilkan oleh data jadi pengetahuan dapat dimanfaatkan untuk estimasi, prediksi, dsb. 

Level Pengolahan Data (Source : 1 Hour Online Training: Data Mining - YouTube)
Level Pengolahan Data (Source : 1 Hour Online Training: Data Mining - YouTube)

Proses ekstrak pengetahuan untuk menemukan pola dari suatu data yang besar disebut dengan data mining. Dalam proses data mining secara sederhana, himpunan data -> metode data mining -> pengetahuan.

Kasus Yang Dapat Dilakukan Proses Data Mining (Source :  1 Hour Online Training: Data Mining - YouTube)
Kasus Yang Dapat Dilakukan Proses Data Mining (Source :  1 Hour Online Training: Data Mining - YouTube)

Proses Decision Tree Dari Kasus Sebelumnya (Source :  1 Hour Online Training: Data Mining - YouTube)
Proses Decision Tree Dari Kasus Sebelumnya (Source :  1 Hour Online Training: Data Mining - YouTube)

Dalam data mining terdapat dua metode/gaya yang digunakan yaitu gaya statistik dan gaya heuristik. Statistik secara umum adalah sekelompok metode dan juga aturan tentang pengumpulan, analisis, pengolahan dan juga penafsiran data pada angka-angka yang akan mennjelaskan sebuah data tersebut atau hasil dari pengamatannya. Adapun gaya statistik yang dimaksud dalam data mining adalah pengembangan daya kritik dalam suatu kegiatan pengambilan keputusan dengan menggunakan cara-cara kuantitaif. Sedangkan untuk gaya heuristik sendiri adalah teknik yang dirancang untuk memecahkan masalah dengan mengabaikan apakah solusi yang dihasilkan dapat dibuktikan (secara matematis) benar.

Data mining sangat populer diterapkan sekarang untuk menngolah data-data dari suatu sektor kehidupan masyarakat yang tentunya dengan jumlah data yang sangat besar. Lantas apakah ada masalah yang timbul di data mining? jawabannya adalah ADA. Diantara banyaknya sisi positif dalam data mining, berikut merupakan masalah umum yang terdapat di data mining :

  • Data yang diolah besar, karena hal ini maka algoritma data mining yang digunakan harus memiliki sifat scalable yang tinggi untuk memproses misalnya terabyte data.
  • Atribut/dimension data yang banyak, contohnya seperti micro-array yang dapat memiliki 10 ribu dimensi atau atribut.
  • Data yang beranekaragam/kompleks, karena sumber data katakanlah data sampel yang terlibat dalam suatu kasus untuk dilakukan data mining itu lebih dari satu misalnya terdapat data streams dan data sensor, atau terdapat data program software dan data scientific simulations.
  • Penerapan data mining yang masih abu-abu karena tergolong bidang ilmu yang baru.

Peran Utama & Metode Data Mining

HALAMAN :
  1. 1
  2. 2
  3. 3
Mohon tunggu...

Lihat Konten Ilmu Alam & Tekno Selengkapnya
Lihat Ilmu Alam & Tekno Selengkapnya
Beri Komentar
Berkomentarlah secara bijaksana dan bertanggung jawab. Komentar sepenuhnya menjadi tanggung jawab komentator seperti diatur dalam UU ITE

Belum ada komentar. Jadilah yang pertama untuk memberikan komentar!
LAPORKAN KONTEN
Alasan
Laporkan Konten
Laporkan Akun