Mohon tunggu...
Muhamad syahreza jaelani
Muhamad syahreza jaelani Mohon Tunggu... Mahasiswa - Mahasiswa Universitas Haluoleo

Nama : Muhamad syahreza jaelani Nim : E1E120015

Selanjutnya

Tutup

Ilmu Alam & Tekno

Data Mining #3

19 Oktober 2022   14:30 Diperbarui: 19 Oktober 2022   14:31 171
+
Laporkan Konten
Laporkan Akun
Kompasiana adalah platform blog. Konten ini menjadi tanggung jawab bloger dan tidak mewakili pandangan redaksi Kompas.
Lihat foto
Ilmu Alam dan Teknologi. Sumber ilustrasi: PEXELS/Anthony

Seperti yang telah dijelaskan pada artikel sebelumnya, data mining dapat digunakan untuk berbagai keperluan dengan data. Diantaranya yaitu klasifikasi data, clustering data, prediksi data, dan asosiasi data. Dan seperti yang telah dijelaskan sebelumnya juga, bahwa dalam data mining ada beberapa tahapan yang disebut dengan metode KNN (Knowledge Discovery in Database), yaitu tahapan data cleansing,  data integration, selection, data transformation, data mining, pattern analysis, dan knowledge presentation.

Kali ini saya akan menjelaskan tentang bebeerapa algoritma yang digunakan dalam data mining. Tentunya dalam melakukan berbagai hal yang bersangkutan dengan data mining seperti klasifikasi, clustering dll. membutuhkan sebuah algoritma khusus untuk memproses data tersebut. Adapun algoritma algoritma tersebut antara lain : 

           Algoritma C-45 adalah sebuah algoritma dalam data mining, dimana algoitma ini akan membuat classifier dari data dalam bentuk pohon keputusan. Dalam algoritma C-45, sistem mengambil input dari sekumpulan kasus, di mana setiap kasus termasuk dalam salah satu dari beberapa kategori dan dideskripsikan oleh nilai dari set atribut tetapnya. Pengklasifikasi keluaran dapat secara akurat memprediksi tingkat yang dimilikinya. 

  • Algoritma K-means

           Algoritma C-45 adalah sebuah algoritma dalam data mining, dimana algoitma ini akan membuat sebauh k-grup (menggunakan variabel k) dari sekumpulan objek untuk mengelompokkan item yang serupa. Biasanya digunakan dalam teknik analisis cluster untuk menganalisis kumpulan data lebih teliti. 

  • Algoritma apriori

           Dengan kata lain, algoritma apriori adalah algoritma berbasis aturan asosiasi yang menganalisis frekuensi objek berpasangan. Algoritma apriori ini menggunakan pendekatan bottom-up.

  • Algoritma naive baiyes

           Algoritma ini didasarkan pada teorema Bayes. Algoritma ini terutama digunakan ketika dimensi input tinggi. Pengklasifikasi dapat dengan mudah menghitung kemungkinan keluaran berikutnya. Algoritma naive baiyes ini  menggunakan teknik supervised klasifikasi objek di masa depan dengan menetapkan label kelas ke instance/catatan menggunakan probabilitas bersyarat. 

  • Algoritma K-Nearest neighbor (KNN)

           Algoritma KNN adalah sebuah algoritma dalam data mining, dimana algoitma ini adalah suatu metode yang menggunakan algoritmasupervised dimana hasil dari query instance yang baru diklasifikan berdasarkan mayoritas dari kategori pada KNN. Tujuan dari algoritma ini adalah mengklasifikasikan obyek baru bedasarkan atribut dan training sample. 

Selain memerlukan algoritma algoritma data mining seperti yang disebutkan diatas, kita juga perlu melakukan evaluasi terhadap metode yang kita gunakan dalam melakukan data mining. Adapun evaluasi tersebut bisa dilakukan dengan menggunakan metode lainnya, seperti : 

  • Confusion matrix, yaitu sebuah metode untuk menguji atau mengevaluasi berdasarkan ketepatan data, yaitu dengan membandingkan data sebelum dilolah dengan data sesudah diolah untuk menghasilkan persentase ketepatan data.
  • ROC Curve, adalah metoe untuk menguji atau mengevaluasi berdasarkan performance atau kualitas. Metode ini bertujuan untuk mengetahui apakah data sudah layakatau pantas untuk dilihat / disajikan, berdasarkan treshold dari data tersebut.

Sekian artikel kali ini, semoga bermanfaat dan dapat menambah wawasan kita. Terima kasih

Mohon tunggu...

Lihat Konten Ilmu Alam & Tekno Selengkapnya
Lihat Ilmu Alam & Tekno Selengkapnya
Beri Komentar
Berkomentarlah secara bijaksana dan bertanggung jawab. Komentar sepenuhnya menjadi tanggung jawab komentator seperti diatur dalam UU ITE

Belum ada komentar. Jadilah yang pertama untuk memberikan komentar!
LAPORKAN KONTEN
Alasan
Laporkan Konten
Laporkan Akun