Menurut Larose, tahun 2005 data mining mempunyai lima peran utama untuk mempermudah suatu pembuatan sistem yaitu estimasi, forecasting, klaisfikasi, klastering, dan asosiasi. Dalam artikel ini akan dibahas salah satu peran dari data mining yang menurut penulis sangat penting untuk memahaminya yaitu klasifikasi.
Klasifikasi merupakan suatu proses mengelompokkan suatu data berdasarkan kriteria dan kesamaan terhadap data sampel/data training. Syarat utama untuk melakukan proses klasifikasi dalam data mining adalah data yang digunakan sudah harus mempunyai label untuk menentukan hasil akhir saat melakukan proses klasifikasi.
Pengelompokan dalam proses klasifikasi ini dilihat berdasarkan featur/ciri dari data training yang telah dimasukan sebelumnya untuk menentukan hasil keluaran untuk data test sehingga pada saat data test dicocokan dengan data training, hasil dari klasifikasinya adalah data test tersebut masuk ke label apa dalam data training.
Untuk melakukan klasifikasi dalam data mining ada beberapa algoritma klasifikasi yang dapat kita gunakan untuk membantu kita mendapatkan nilai akurasi dalam proses klasifikasi yaitu algoritma C4.5, algoritma K-Means, algoritma Nive Bayes, algoritma Priori dan masih banyak lagi jenis algoritma klasifikasi lainnya.
Baca konten-konten menarik Kompasiana langsung dari smartphone kamu. Follow channel WhatsApp Kompasiana sekarang di sini: https://whatsapp.com/channel/0029VaYjYaL4Spk7WflFYJ2H