Lihat ke Halaman Asli

Marsita Harim

Mahasiswa Universitas Halu Oleo

Peran Utama dan Metode Data Mining

Diperbarui: 19 Oktober 2022   18:01

Kompasiana adalah platform blog. Konten ini menjadi tanggung jawab bloger dan tidak mewakili pandangan redaksi Kompas.

Koleksi Pribadi

Pada artikel sebelumnya kita telah membahas mengenai DATA. Pada artikel ini saya akan memperkenalkan kepada anda Metode dalam Data Mining. Ada 5 metode dalam Data Mining yang sering dikenal dan digunakan, yaitu Estimasi, Forecasting, Klasifikasi, Clustering, dan Asosiasi. Sebelum masuk pada penjelasan metode data mining tersebut, terlebih dahulu kita mengenal istilah-istilah terkait tabel dibawah ini :

Koleksi Pribadi

  • Instance merupakan baris dari suatu tabel, dimana pada bagian ini menunjukan suatu observasi atau pengamatan dari domain permasalahan.
  • Feature/attribute/dimension merupakan kolom dari suatu tabel. Feature ini menunjukan suatu komponen dari observasi atau pengamatan. Sebagian feature adalah hasil prediksi atau output dari feature yang diprediksi, dan sebagiannya lagi adalah input dari model.
  • Data set adalah sekumpulan instance(baris)
  • Data type; tentunya masing-masing feature memiliki yang namanya tipe data.

Itulah penjelasan mengenai istilah-istilah yang terdapat pada tabel. Sekarang kita masuk dalam penjelasan mengenai metode dalam data mining, berikut penjelasannya :

  • Estimasi adalah suatu metode yang biasanya digunakan untuk membuat atau memperkirakan nilai populasi untuk mendukung suatu keputusan, menjadwalkan suatu pekerjaan atau proyek, dsb dengan menggunakan nilai sampel.
  • Forecasting atau bisa kita sebut juga sebagai prediksi adalah salah satu metode untuk membuat suatu perencanaan dari suatu prediksi yang akan digunakan untuk mengetahui suatu hal yang belum pasti masa yang akan datang. Biasanya forecasting digunakan ketika natal, idul fitri, dan sebagainya.
  • Klasifikasi (classification) adalah bentuk analisis data yang mengekstrak model yang menggambarkan kelas data penting. Model semacam itu, yang disebut pengklasifikasi, memprediksi label kelas kategorikal. Misalnya, kita dapat membangun model klasifikasi untuk mengkategorikan aplikasi pinjaman bank sebagai aman atau berisiko. Analisis semacam itu dapat membantu memberi kita pemahaman yang lebih baik tentang data secara luas. Sebagian besar algoritma adalah bagian/penduduk memori, biasanya dengan asumsi ukuran data yang kecil. Penelitian data mining baru-baru ini telah dibangun di atas pekerjaan seperti itu, mengembangkan klasifikasi yang dapat diskalakan dan teknik prediksi yang mampu menangani sejumlah besar data residen disk. Klasifikasi memiliki banyak aplikasi, termasuk deteksi penipuan, target pemasaran, prediksi kinerja, manufaktur, dan diagnosis medis
  • Clustering adalah salah satu metode untuk mengelompokkan instance (sample) menjadi beberapa grup atau subset atau cluster berdasarkan “kemiripan” dengan instance yang lain.

Sebelum masuk di penjelasan asosiasi, terlebih dahulu kita melihat perbedaan antara classification dan clustering :

* Pada clustering datanya tidak berlabel sedangkan pada classification datanya berlabel

* Clustering merupakan unsupervised learning sedangkan classification itu supervised learning

* Dilihat dari tujuannya, clustering bertujuan untuk membentuk kelompok berdasarkan pola kemiripan “pattern similarities” antar sample. Sedangkan classification bertujuan untuk membentuk kelas (class) berdasarkan feature yang disediakan oleh data set.

* Pada clustering, jumlah kelompoknya (cluster) belum pasti (tidak diketahui dari awal). Sedangkan classification sudah pasti (diketahui dari awal)

* Algoritma pada clustering : K-means, KNN, Naïve Bayes Classifier, Expectation Maximization, dsb. Sedangkan pada classification : Decision Tree, SVM, Neural Network, dsb

Teknik clustering banyak diaplikasikan atau diimplementasikan pada bidang : market segmentation, social network analysis, computer cluster, astronomical data analysis.

  • Asosiasi atau bisa juga kita sebut basket analysis. Metode ini sering kali digunakan untuk masalah bisnis, misalnya menganalisis transaksi penjualan dan juga melakukan pengamatan produk-produk yang dibeli secara bersamaa. Mungkin teman-teman pernah mendengar yang namanya Market Basket Analysis (MBA). MBA merupakan suatu teknik penambangan untuk mengetahui pola pembelian. Contohnya ketika seseorang membeli mie ada kecenderungan orang tersebut akan membeli telur juga sebagai pendamping mie. Inilah yang akan dilihat sehingga akan membantu suatu toko atau warung meletakkan produk-produk tersebut secara beriringan atau memberikan diskon atau juga beli 1 mie gratis 1 telur.
Halaman Selanjutnya


BERI NILAI

Bagaimana reaksi Anda tentang artikel ini?

BERI KOMENTAR

Kirim

Konten Terkait


Video Pilihan

Terpopuler

Nilai Tertinggi

Feature Article

Terbaru

Headline