Mohon tunggu...
MUHAMMAD RAHMAT DHYAN F.
MUHAMMAD RAHMAT DHYAN F. Mohon Tunggu... Mahasiswa - MAHASISWA SEMESTER LEWAT PERTENGAHAN

E1E120084

Selanjutnya

Tutup

Ilmu Alam & Tekno

Pengolahan Data pada Data mining Metode dan Evaluasi

19 Oktober 2022   21:50 Diperbarui: 19 Oktober 2022   22:11 458
+
Laporkan Konten
Laporkan Akun
Kompasiana adalah platform blog. Konten ini menjadi tanggung jawab bloger dan tidak mewakili pandangan redaksi Kompas.
Lihat foto
Ilmu Alam dan Teknologi. Sumber ilustrasi: PEXELS/Anthony

Metode pengolahan dan evaluasi data pada datamining

Assalamualaikum warahmatullahi wabarakatuh 

pada artikel ini masih membahas tentang Data mining yang pada artikel sebelumnya membahas Knowledge Discovery in Database atau KDD. Kali ini saya akan membahas tentang klasifikasi atau pengelompokan suatu objek yang telah kita amati.

Sebelum kita lanjut ke tahapan klasifikasi maka kita perlu ketahui ada beberapa tahapan pada pengolahan data mining ini sendiri yaitu :

  • Pembersihan data (untuk membuang data yang tidak konsisten dan noise)
  • Integrasi data (penggabungan data dari beberapa sumber)
  • Transformasi data (data diubah menjadi bentuk yang sesuai untuk di-mining)
  • Aplikasi teknik Data Mining, proses ekstraksi pola dari data yang ada

  • Evaluasi pola yang ditemukan (proses interprestasi pola menjadi pengetahuan yang dapat digunakan untuk mendukung pengambilan keputusan)

  • Presentasi pengetahuan (dengan teknik visualisasi)

Saat ini kita ada pada proses yang 4. Nah setelah kita mengetahui data yang kita gunakan selanjutnya kita akan melakukan pengolahan pada data tersebut. Dalam proses data mining ini sendiiri ada beberapa algoritma/metode yang digunakan untuk mengolah data yang telah dapatkan dari penelitian kita yaitu :

Metode Decision Tree Metode pohon keputusan adalah metode klasifikasi yang menggunakan algoritma untuk menentukan kemungkinan hasil, hasil, risiko, dll dalam struktur pohon. Contoh metodenya yaitu:C4.5 dan  Credal C4 dsb.

Metode NB (Naive Bayes) merupakan salah satu metode yang digunakan untuk data yang berkualitas tinggi karena dapat mengefisienkan waktu penggunaan dan mudah digunakan karena tidak menggunakan teknik optimasi numerik.

Metode K-NN (K-Nearest Neighbor) yang merupakan salah satu metode pengklasifikasian data berupa citra atau citra dengan tanda atau label, artinya metode ini mengklasifikasikan data menurut item data yang baru. K-Means berbeda dengan kNN. K-Means lebih umum digunakan untuk clustering, sedangkan kNN digunakan untuk klasifikasi

Metode LDA (Linear Discriminant Analysis) adalah suatu metode pengelompokan dan pengklasifikasian data ke dalam kelompok-kelompok, yaitu mengekstraksi ciri-ciri data dari level teratas ke level terbawah dalam suatu unit.

LR (Regresi Logistik) yang merupakan salah satu metode yang digunakan untuk mengklasifikasikan data dengan menganalisis data secara statistik, artinya kita dapat mengetahui  terlebih dahulu atau memprediksi hasil apa yang akan diperoleh ketika ada beberapa kelas yang harus diklasifikasikan di  antara beberapa kelas. . data agar  lebih akurat dan berpikir jernih sebelum mengambil keputusan.

 Metode diatas adalah bentuk proses ataupun pengolahan data mining sebagaimana mestinya. Setelah kita klasifikasi maka kita perlu evaluasi untuk memperoleh akurasi data yang maksimal dan juga untuk menguji hipotesis awal penelitian. 

Kemudian ada beberapa metode yang digunakan untuk mengevaluasi hasil dari penggunaan metode ekstraksi tersebut yakni pertama Confusion matrix, cara untuk mengevaluasi klasifikasi data mining dengan fokus pada akurasi data. 

Dengan kata lain, metode ini dilakukan dengan cara membandingkan data yang diperoleh dari hasil klasifikasi dengan data yang telah ada sebelumnya untuk mengetahui keakuratan data tersebut. Dan yang kedua adalah ROC Curve, yang merupakan metode evaluasi klasifikasi data mining yang berfokus pada kinerja atau tampilan data. 

Dengan kata lain, metode ini digunakan untuk menentukan apakah data yang dipilih atau digunakan dapat digunakan berdasarkan ambang model data. Selain itu, kurva ROC memiliki apa yang disebut Area Under the Curve (AUC), yaitu bagian dari kurva ROC di bawahnya, yang merupakan salah satu cara untuk membantu proses evaluasi klasifikasi data, karena  terletak pada kurva, yang merupakan perbandingan model data, salah satunya data. model dan  lainnya.

Mungkin itu saja yang bisa saya sampaikan pada artikel ini jika ada kesalahan kata dalam artikel ini mohon dimaafkan karena kesalahan milik saya sepenuhnya dan kebenaran adalah milik allah swt sekian terima kasih.

wasalamualaikum warahmatullahi wabarakatuh.

oh iya untuk rujukan artikel ini ada disini

Baca konten-konten menarik Kompasiana langsung dari smartphone kamu. Follow channel WhatsApp Kompasiana sekarang di sini: https://whatsapp.com/channel/0029VaYjYaL4Spk7WflFYJ2H

HALAMAN :
  1. 1
  2. 2
Mohon tunggu...

Lihat Konten Ilmu Alam & Tekno Selengkapnya
Lihat Ilmu Alam & Tekno Selengkapnya
Beri Komentar
Berkomentarlah secara bijaksana dan bertanggung jawab. Komentar sepenuhnya menjadi tanggung jawab komentator seperti diatur dalam UU ITE

Belum ada komentar. Jadilah yang pertama untuk memberikan komentar!
LAPORKAN KONTEN
Alasan
Laporkan Konten
Laporkan Akun