Mohon tunggu...
Marsita Harim
Marsita Harim Mohon Tunggu... Mahasiswa - Mahasiswa Universitas Halu Oleo

Hobi saya membaca dan juga mendengarkan musik.

Selanjutnya

Tutup

Ilmu Alam & Tekno

Peran Utama dan Metode Data Mining

19 Oktober 2022   17:03 Diperbarui: 19 Oktober 2022   18:01 2657
+
Laporkan Konten
Laporkan Akun
Kompasiana adalah platform blog. Konten ini menjadi tanggung jawab bloger dan tidak mewakili pandangan redaksi Kompas.
Lihat foto
Bagikan ide kreativitasmu dalam bentuk konten di Kompasiana | Sumber gambar: Freepik

Pada artikel sebelumnya kita telah membahas mengenai DATA. Pada artikel ini saya akan memperkenalkan kepada anda Metode dalam Data Mining. Ada 5 metode dalam Data Mining yang sering dikenal dan digunakan, yaitu Estimasi, Forecasting, Klasifikasi, Clustering, dan Asosiasi. Sebelum masuk pada penjelasan metode data mining tersebut, terlebih dahulu kita mengenal istilah-istilah terkait tabel dibawah ini :

Koleksi Pribadi
Koleksi Pribadi
  • Instance merupakan baris dari suatu tabel, dimana pada bagian ini menunjukan suatu observasi atau pengamatan dari domain permasalahan.
  • Feature/attribute/dimension merupakan kolom dari suatu tabel. Feature ini menunjukan suatu komponen dari observasi atau pengamatan. Sebagian feature adalah hasil prediksi atau output dari feature yang diprediksi, dan sebagiannya lagi adalah input dari model.
  • Data set adalah sekumpulan instance(baris)
  • Data type; tentunya masing-masing feature memiliki yang namanya tipe data.

Itulah penjelasan mengenai istilah-istilah yang terdapat pada tabel. Sekarang kita masuk dalam penjelasan mengenai metode dalam data mining, berikut penjelasannya :

  • Estimasi adalah suatu metode yang biasanya digunakan untuk membuat atau memperkirakan nilai populasi untuk mendukung suatu keputusan, menjadwalkan suatu pekerjaan atau proyek, dsb dengan menggunakan nilai sampel.
  • Forecasting atau bisa kita sebut juga sebagai prediksi adalah salah satu metode untuk membuat suatu perencanaan dari suatu prediksi yang akan digunakan untuk mengetahui suatu hal yang belum pasti masa yang akan datang. Biasanya forecasting digunakan ketika natal, idul fitri, dan sebagainya.
  • Klasifikasi (classification) adalah bentuk analisis data yang mengekstrak model yang menggambarkan kelas data penting. Model semacam itu, yang disebut pengklasifikasi, memprediksi label kelas kategorikal. Misalnya, kita dapat membangun model klasifikasi untuk mengkategorikan aplikasi pinjaman bank sebagai aman atau berisiko. Analisis semacam itu dapat membantu memberi kita pemahaman yang lebih baik tentang data secara luas. Sebagian besar algoritma adalah bagian/penduduk memori, biasanya dengan asumsi ukuran data yang kecil. Penelitian data mining baru-baru ini telah dibangun di atas pekerjaan seperti itu, mengembangkan klasifikasi yang dapat diskalakan dan teknik prediksi yang mampu menangani sejumlah besar data residen disk. Klasifikasi memiliki banyak aplikasi, termasuk deteksi penipuan, target pemasaran, prediksi kinerja, manufaktur, dan diagnosis medis
  • Clustering adalah salah satu metode untuk mengelompokkan instance (sample) menjadi beberapa grup atau subset atau cluster berdasarkan “kemiripan” dengan instance yang lain.

Sebelum masuk di penjelasan asosiasi, terlebih dahulu kita melihat perbedaan antara classification dan clustering :

* Pada clustering datanya tidak berlabel sedangkan pada classification datanya berlabel

* Clustering merupakan unsupervised learning sedangkan classification itu supervised learning

* Dilihat dari tujuannya, clustering bertujuan untuk membentuk kelompok berdasarkan pola kemiripan “pattern similarities” antar sample. Sedangkan classification bertujuan untuk membentuk kelas (class) berdasarkan feature yang disediakan oleh data set.

* Pada clustering, jumlah kelompoknya (cluster) belum pasti (tidak diketahui dari awal). Sedangkan classification sudah pasti (diketahui dari awal)

* Algoritma pada clustering : K-means, KNN, Naïve Bayes Classifier, Expectation Maximization, dsb. Sedangkan pada classification : Decision Tree, SVM, Neural Network, dsb

Teknik clustering banyak diaplikasikan atau diimplementasikan pada bidang : market segmentation, social network analysis, computer cluster, astronomical data analysis.

  • Asosiasi atau bisa juga kita sebut basket analysis. Metode ini sering kali digunakan untuk masalah bisnis, misalnya menganalisis transaksi penjualan dan juga melakukan pengamatan produk-produk yang dibeli secara bersamaa. Mungkin teman-teman pernah mendengar yang namanya Market Basket Analysis (MBA). MBA merupakan suatu teknik penambangan untuk mengetahui pola pembelian. Contohnya ketika seseorang membeli mie ada kecenderungan orang tersebut akan membeli telur juga sebagai pendamping mie. Inilah yang akan dilihat sehingga akan membantu suatu toko atau warung meletakkan produk-produk tersebut secara beriringan atau memberikan diskon atau juga beli 1 mie gratis 1 telur.

HALAMAN :
  1. 1
  2. 2
Mohon tunggu...

Lihat Konten Ilmu Alam & Tekno Selengkapnya
Lihat Ilmu Alam & Tekno Selengkapnya
Beri Komentar
Berkomentarlah secara bijaksana dan bertanggung jawab. Komentar sepenuhnya menjadi tanggung jawab komentator seperti diatur dalam UU ITE

Belum ada komentar. Jadilah yang pertama untuk memberikan komentar!
LAPORKAN KONTEN
Alasan
Laporkan Konten
Laporkan Akun