Halo haloo! bertemu kembali dengan artikel saya, pada kesempatan kali ini di artikel kali ini akan menjelaskan  materi yang masih berhubungan dengan artikel-artikel yang lalu masih dalam seputaran data mining yaa.... Kali ini artikel ini akan membahas mengenai algoritma yang digunakan dalam data mining.Â
Proses pengolahan data dalam data mining dibutuhkan algoritma-algoritma untuk melakukan ekstraksi menjadi informasi/pola/pengetahuan. Ada beberapa algoritma yang digunakan ketika kita akan mengolah sebuah data yaitu seperti berikut :
1. Algoritma Klasifikasi
2. Algoritma Klastering
3. Algoritma Asosiasi
4. Algoritma Estimasi dan Forecasting
Algorita diatas mungkin sudah sering kita dengar apalagi bagi orang - orang yang sering bermain dengan data-data, sudah tidak asing lah dengan algoritma-algoritma diatas. Untuk yang baru mengetahui jangan putus asa karna artikel ini akan membahas mengenai algoritma-algoritma tersebut. Cekidott!!!
Algoritma KlasifikasiÂ
Klasifikasi merupakan suatu proses pengkategorian yang digunakan untuk menentukan kelas dari data yang tidak di ketahui label class nya. Memprediksi label kelas adalah tujuan utama dari klasifikasi ini.Â
Dua tahapan yang dimiliki pada poses klasifikasi, yaitu terlebih dahulu learning yang mana learning ini menganalisa sebuah data training dengan menggunakan algoritma klasifikasi, lalu proses klasifikasi yaitu memprediksi ketepatan dari klasifikasi dengan menggunakan data testing. Klasifikasi data dapat dimulai dengan membuat aturan klasifikasi tertentu menggunakan data latih dan data uji.Â
Dalam algoritma klasifikasi ini memilik beberapa jenis algoritma juga antara lain yaitu :
- Decision Tree
Metode Decision Tree adalah sebuah metode klasifikasifikasi yang menggunakan struktur pohon, secara ekspilist decision tree menggambarkan suatu pola/pengetahuan ataupun informasi dalam bentuk pohon keputusan.Â
Pohon dibangun dengan cara membagi dan menaklukkan rekursif top-down. Algoritma ini menyertakan pernyataan kontrol bersyarat untuk mengklasifikasikan data. sebuah pohon keputusan dimulai pada satu titik atau simpul yang kemudian bercabang dalam dua arah atau bisa juga lebih dan pada setiap cabang memilik hasil yang berbeda sampai pada hasil yang dicapai atau goals nya.
Jenis-jenis algoritma decsision tree yang banyak digunakan adalah algoritama C.45 menggunakan atribut Gain Ratio, ID3 (Iterative Dichotimiser 3) dengan atribut Information Gain, CART (Classification Regression Tree) dengan atribut Gini Index.Â
- Bayesian Classfication atau Naive Bayes
Metode Naive Bayes adalah metode pengklasifikasian dengan menggunakan metode probabilitas dan statistik yang berakar pada teorema bayes, yaitu memprediksi peluang di masa depan berdasarkan pengalaman di masa sebelumnya.Â
Naive Bayes memiliki tingkat akurasi yang lebih baik dan keuntungan menggunakan metode ini kita hanya membutuhkan jumlah data training yang kecil untuk menentukan estimasi parameter yang dibutuhkan dalam proses klasifikasi. Algoritma naive bayes sangat cocok untuk melakukan klasifikasi pada data set yang bertipe nominal.
- K-Nearest Neighbor (k-NN)
K-Nearest Neighbor adalah sebuah metode untuk melakukan klasifikasi terhadap objek berdasarkan data pembelajaran yang jaraknya paling dekat dengan objek tersebut. Prinsip daripada algoritma ini adalah menghitung jarak terdekat dari data baru dengan tetangga terdekatnya dan mengandalkan memori yang mayoritas tetangga klasifikasi.Â
K-NN banyak digunakan oleh para peniliti karena memberikan hasil akurasi yang baik pada data yang berjumlah besar.
Mungkin itu saja untuk pembahasan mengenai Algoritma Klasifikasi yang digunakan pada data mining, tunggu dan pantangin tru s artikel ini yang akan terus membahas mengenai data mining. Jangan bosan-bosan membaca karena membaca adalah jendal dunia. See you the next artikel.....
Baca konten-konten menarik Kompasiana langsung dari smartphone kamu. Follow channel WhatsApp Kompasiana sekarang di sini: https://whatsapp.com/channel/0029VaYjYaL4Spk7WflFYJ2H