Seperti dari beberapa artikel saya sebelumnya, kita masih berbicara mengenai suatu metode, teknik atau cara untuk mengumpulkan, mengelolah, menganilisis dan membuat keputusan sesuai dengan data yang di dapatkan dengan tujuan untuk memberikan pengetahuan dari informasi sesuai dengan hasil yang di peroleh yang dapat memberikan manfaat tentunya, yang lebih tepatnya kita kenal dengan istilah data mining. Akan tetapi, pada kesempatan ini kita akan membahas lebih detail mengenai salah satu konsep dan teori dasar tentang data mining. Yang menjadi pertanyaan, "Apa yang menjadi konsep dan teori dasar dari data mining" ? .
Konsep dan teori dasar dari data mining pada dasarnya dibagi menjadi 3 bagian, ada yang dikenal dengan Klasifikasi, Asosiasi dan juga Clustering. Banyak hal-hal yang menjadi komponen sebuah data mining akan tetapi, terdapat tiga konsep dasar dalam penggunaan data mining seperti yang telah saya jelaskan diatas. Terdapat istilah yang menyebutkan Data Mining Rules atau peran utama data mining yaitu dimulai dari Estimasi, Forecasting, Klasifikasi, Clustering dan asosiasi. Kita akan membahas lebih detail mengenai salah - satu konsep dasar sekaligus sebagai data mining rules dari data mining yaitu, Klasifikasi.
Klasifikasi atau classification dalam data mining adalah, salah satu bagian dari metode data mining yang menjadi metode atau cara untuk menggunakan data mining. Klasifikasi merupakan suatu cara atau metode untuk mengelompokkan dan menentukan algoritma sebuah data kedalam sebuah kriteria atau kelompok data sesuai dengan keterkaitannya atas data yang dimiliki dalam hal ini data sampel.
Dalam data mining, ketika menggunakan metode klasifikasi tentunya memiliki banyak jenis metode klasifikasi yang sering di gunakan yaitu seperti :
1. Metode Decision Tree, yaitu sebuah metode klasifikasi dengan menggunakan algoritma dengan cara membuat sebuah keputusan dalam bentuk seperti struktur pohon yang terdiri dari apa yang menjadi kemungkinan sebuah hasilnya, konsekuensi ataupun resikonya dan lain sebagainya. Metode ini diantaranya seperti : C4.5, Credal C4, Credal DT, Adaptative Credal C4.5 , CART dan ID3.
2. Metode Naive Bayes, yaitu salah satu metode yang di gunakan untuk data - data dalam kualifikasi yang tinggi karena memiliki kemampuan untuk mengefesienkan waktu dalam penggunaannya dan lebih mudah digunakan karena dalam penggunaanya tidak menggunakan tehnik optimalisasi yang numerik.
3. Metode K-Nearest Neighbor ( kNN ), yaitu salah satu metode yang di gunakan untuk mengklasifikasi sebuah data dalam bentuk gambar atau picture melalui sebuah merek atau laber artinya metode ini mengklasifikasikan data sesuai dari objek baru data tersebut. K-Means berbeda dengan kNN. K-Means lebih sering digunakan untuk Clustering sedangkan kNN di gunakan untuk klasifikasi.
4. Linear Discriminant Analysis ( LDA ) , yaitu salah satu metode yang digunakan untuk mengklasifikasi data dengan cara mengelompokkan data kedalam beberapa kelompok dengan kata lain melakukan pengekestrakan karakteristik data dari tingkat yang tinggi ke tingkat yang lebih rendah dalam satu kesatuan.
5. Logistic Regression ( LogR ), yaitu salah satu metode yang digunakan untuk mengklasifikasi data dengan cara melakukan analisis data dalam konsep statistika artinya kita dapat mengetahui ataupun mempredisiksi terlebih dahulu mengenai hasil yang akan di dapatkan apabila terdapat beberapa kategori yang harus di klasifikan antara beberapa data agar dapat lebih akurat dan jelas sebagai cara agar terdapat pertimbangan sebelum mengambil keputusan.
Dari ke lima metode diatas, metode ini yang sering digunakan untuk melakukan klasifikasi terhadap suatu data dalam hal ini data mining. Akan tetapi, tidak menutup kemungkinan masih banyak metode-metode lain yang mungkin dijadikan sebagai metode dalam melakukan klasifikasi dalam data mining.
Selain itu, setelah menggunakan metode yang telah disebutkan diatas, kita juga perlu meneliti dan mengecek kembali metode tersebut dengan cara mengevaluasi metode-metode untuk melakukan klasifikasi tersebut. Metode evaluasi data mining dalam hal Klasifikasi dibagi menjadi 2 cara yaitu diantaranya sebagai berikut :