Rangkuman Materi Mata kuliah Data Mining Pada Pertemuan ke-3 (22 September 2022)
Pola yang Sering?Analisis?
Pola yang sering: pola (satu set item, urutan,substruktur, dll.) yang sering muncul dalam kumpulan data Pertama kali diusulkan oleh Agrawal, Imielinski, dan Swami (AIS93] diKonteks itemset yang sering dan penambangan aturan asosiasi. Motivasi: Menemukan keteraturan yang melekat dalam data
* Produk apa yang sering dibeli bersama?- Bir dan popok?!
* Apa saja pembelian selanjutnya setelah membeli PC?
* Jenis DNA apa yang sensitif terhadap obat baru ini?
Mengapa Frek. Penambangan Pola Penting?
Pola frekuensi: Sifat intrinsik dan penting dari Kumpulan data Dasar untuk banyak tugas penambangan data penting Analisis asosiasi, korelasi, dan kausalitas Pola berurutan, struktural (misalnya, sub-grafik) Analisis pola dalam data spatiotemporal, multimedia, deret waktu, dan aliran Klasifikasi: diskriminatif, analisis pola sering Analisis klaster: pengelompokan berbasis pola yang sering
Data warehousing: iceberg cube dan cube-gradient Kompresi data semantik: facies Aplikasi luas.
Dasar-Dasar Pola sering:
itemset: Satu set satu atau lebihi tem k-itemset X= {Xg...., X,) dukungan (mutlak), atau, jumlah dukungan X: Frekuensi atau kemunculan itemset X (relatif) support, s, adalah pecahan dari transaksi yang mengandung X (yaitu, probabilitas bahwa suatu transaksi mengandung X) Item set X sering terjadi jika dukungan X tidak kurang dari ambang batas minsup.Â