Assalamualaikum teman-teman, Saya Hadijah Nisa Ifayatin NIM E1E120008 Mahasiswa Teknik Informatika.
Pada artikel sebelumnya telah dijelaskan mengenai konsep dasar dari data mining, jenis, macam dan karakteristik Data Mining. Pada artikel kali ini akan membahas tentang klasifikasi pada data mining.
Algoritma dalam data mining atau pada machine learning merupakan kumpulan perhitungan dan penemuan yang dapat memunculkan dan membuat model melalui pengolahan data yang ada. Dalam pengolahan data tersebut tentunya di perlukan analisis sebagai langkah awal agar dapat menentukan hasil apa yang diinginkan atau yang akan dicapai yang kemudian dilanjutkan dengan pencarian pola.
Untuk menemukan parameter terbaik dalam menentukan atau membuat model dalam pengembangan yang akan dilakukan maka butuh hasil analisis menggunakan algoritma yang telah di pilih dan ditentukan. Guna dari parameter ini adalah untuk mengekstrak statistik yang lebih rinci dan mengekstrak pola operasional yang diperoleh dengan menerapkannya ke seluruh data.
Perlu diingat dalam penggunaan algoritma data mining harus disesuaikan dengan hasil atau kegunaan penelitian yang ada. Adapun beberapa algoritma klasifikasi data mining yang digunakan secara umum ada beberapa yaitu algoritma Decision Tree, algoritma Priori, algoritma k-Means, algoritma SVM (Support Vector Machines), Algoritma Navie Bayes, AdaBoost. Adapun penjelasan lengkapnya adalah sebagai berikut :
1. Algoritma Decision Tree
AlgoDecisiom Tree merupakan algoritma pengklasifikasian dalam data mining yang cukup popular atau lebih banyak digunakan. Descision Tree, yaitu algoritma yang berbentuk seperti pohon dalam pengambilan keputusan yang berisi tentang resiko, konsekuensi ataupun prediksi hasil yang akan dicapai nantinya, dan sebagainya. Adapun metode descision tree diantaranya adalah Credal DT, Credal C4, Adaptive Credal, ID3, CART dan C4.5.
2. Algoritma Priori
Algoritma Priori yaitu proses ekstraksi database yang berupa informasi dilanjutkan dengan pembentukan asosiasi rule mining agar mendapatkan nilai minimum confidance dan minimum support sebagai hasil dengan melakukan frequent pada item/itemset dan candidate generation dalam pembentukannya.
3. Algoritma k-Means
Algoritma k-Means merupakan metode atau algoritma pencarian pada pusat cluster secara iteratif yang jarak antar setiap data ke pusat cluster telah di tetapkan.