Sebelumnya kita sudah membahas mengenai apa itu data mining dan bagaimana tahapan (KDD Process) pada data mining. Nah pada kesempatan kali ini akan membahas mengenai "Peran Utama dan Metode Data Mining."Â
Sebelumnya, kita merefresh dulu apa sih itu data mining? Jadi, Data Mining merupakan disiplin ilmu yang mempelajari metode untuk mengekstrak pengetahuan dari data yang besar.
Bagaimana sih Konsep Alur Proses Data Mining ?
Konsep alur proses data mining adalah Himpunan data -> diolah menggunakan algoritma atau metode data mining -> kemudian jadilah pengetahuan. Contohnya seperti pada prediksi kelulusan mahasiswa, prediksi calon legislatif DKI Jakarta, klasterisasi tingkat kemiskinan dan aturan asosiasi dari data transaksi.
Peran Utama Data Mining
1. Estimasi -> memiliki atribut numerik dan class numerik. Estimasi merupakan algoritma supervised learning yaitu algoritma pembelajaran yang disupervisi oleh class/label. Sedangkan kalau tidak ada class/label berarti termasuk algoritma unsupervised learning.
2. Prediksi -> memiliki atribut numerik dan class numerik. Bedanya dengan estimasi yaitu ada 1 atribut yang timeseries. Forecasting (prediksi) merupakan algoritma supervised learning.
3. Klasifikasi -> memiliki atribut numerik atau nominal dan class nominal. Klasifikasi merupakan algoritma supervised learning.
4. Klastering -> tidak memiliki class/label dan atributnya harus numerik. Klustering merupakan algoritma unsupervised learning.
5. Asosiasi -> hubungan antar atribut misalnya, gula seberapa erat dengan kopi. Atributnya boleh numerik/nominal/binominal. Asosiasi merupakan algoritma semi supervised learning. Pada data asosiasi sebagian mempunyai class/label dan Sebagian tidak mempunyai class/label. Jadi yang mempunyai class/label akan diklasifikasi dan yang tidak memiliki class/label akan diklustering.
Dataset (Himpunan Data) pada Data Mining itu Seperti Apa?
-Â Data yang akan dipakai yaitu ada baris dan ada kolom. Kolom menunjukkan atribut/feature/dimension.
- Dataset sama dengan data lampau.
- Nama lain dari data yaitu record, object, sample, tuple.