Lihat ke Halaman Asli

Clasification Method pada Data Mining

Diperbarui: 19 Oktober 2022   21:26

Kompasiana adalah platform blog. Konten ini menjadi tanggung jawab bloger dan tidak mewakili pandangan redaksi Kompas.

Ilmu Alam dan Teknologi. Sumber ilustrasi: PEXELS/Anthony

Seperti penjelasan pada artikel sebelumnya, kali ini kita juga akan membahas tentang data mining. Sebelum memulai kita definisikan ulang tentang data mining. Data mining dalah proses penarikan data yang sangat besar untuk diterjemahkan kedalam database yang besar sehingga memudahkan dalam pengambilan keputusan suatu masalah dan menentukan pola yang belum diketahui .

Akan tetapi, pada artikel ini kita akan berfokus pada materi konsep dasar data mining yaitu clasification method atau yang biasa kita dengar dengan metode klasifikasi. Jadi, metode klasifikasi adalah salah satu bagian dari konsep dasar dari data mining. Ada beberapa konsep dasar dari data mining seperti asosiasi, dan clustering. 

Klasifikasi merupakan teknik dalam data mining untuk mengelompokkan data berdasarkan keterikatan data terhadap data sampel. Sebelumnya metode klasifikasi ini merupakan bagian dari tipe data mining prediction. Nah, dari prediction inilah terbagi menjadi clasification, regression, dan time series. 

Selanjutnya, pada pemecahan menggunakan metode klasifikasi akan melibatkan algoritma. Ada beberapa algoritma yang sering digunakan, antara lain sebagai berikut : 

1. Decision Tree, adalah sebuah metode klasifikasi dengan menggunakan algoritma dengan cara membuat sebuah keputusan dalam bentuk seperti struktur pohon yang terdiri dari apa yang kemungkinan sebuah hasilnya, konsekuensi ataupun resikonya dan lain sebagainya. Metode ini diantaranya seperti C4.5, Credal C4, Credal CT, Adaptative Credal C4.5, CART, dan ID3.

2. Naive Bayes, adalah salah satu metode yang digunakan untuk data - data dalam kualifikasi yang tinggi karena memiliki kemampuan mengefensienkan waktu dalam penggunaannya dan lebih mudah digunakan karena dalam penggunaannya tidak menggunakan tehnik optimalisasi yang numerik.

3. k-Nearest Neigbhor(kNN), adalah salah satu metode yang di gunakan untuk mengklasifikasikan sebuah data dalam bentuk  gambar atau picture melalui sebuah merek atau label artinya metode ini mengklasifikasikan sesuai dari objek baru data tersebut. k-Means berbeda dengan kNN. k-Means lebih sering digunakan untuk Clustering sedangkan kNN di gunakan untuk klasifikasi.

4. Linear Discriminant Analysis(LDA), adalah salah satu metode yang digunakan untuk mengklasifikasikan data dengan cara mengelompokkan data kedalam beberapa kelompok dengan kata lain melakukan pengekstrakkan karakteristik data dari tingkat yang tinggi ke tingkat yang lebih rendah dalam satu kesatuan.

5. Logistic Regression (LogR), adalah salah satu metode yang digunakan untuk mengklasifikasikan data dengan cara melakukan analisis dalam konsep statistika artinya kita dapat mengetahui ataupun memprediksi  terlebih dahulu mengenai hasil yang akan didapatkan apabila terdapat beberapa kategori yang harus di klasifikasikan antara beberapa data agar dapat lebih akurat dan jelas sebagai cara agar terdapat pertimbangan sebelum mengambil keputusan.

Setelah mengetahui macam - macam algoritma dari metode klasifikasi kita juga harus mengetahui model evaluasinya. Ada beberapa macam model evaluasi dalam data mining. Diantaranya adalah sebagai berikut :

1. Confusion Matrix, yaitu cara evaluasi klasifikasi data mining yang berfokus pada ketepatan data. Artinya, cara ini dilakukan dengan melakukan perbandingan data hasil klasifikasi dengan data yang telah ada sebelumnya untuk menentukan ketepatan data.

Halaman Selanjutnya


BERI NILAI

Bagaimana reaksi Anda tentang artikel ini?

BERI KOMENTAR

Kirim

Konten Terkait


Video Pilihan

Terpopuler

Nilai Tertinggi

Feature Article

Terbaru

Headline