1. Konsep Dasar Analisis Frequent Pattern
- Apa itu Frequent Pattern? Frequent pattern adalah pola (sekumpulan item, subsekuensi, substruktur, dll.) yang sering muncul dalam dataset. Analisis frequent pattern pertama kali diusulkan oleh Agrawal, Imielinski, dan Swami pada tahun 1993, khususnya dalam konteks frequent itemset dan association rule mining.
- Motivasi: Tujuan utama dari analisis frequent pattern adalah untuk menemukan keteraturan yang melekat dalam data. Contohnya, mengidentifikasi produk apa saja yang sering dibeli bersamaan (seperti bir dan popok), menentukan pembelian selanjutnya setelah membeli PC, mengklasifikasikan dokumen web secara otomatis, atau menganalisis urutan DNA yang sensitif terhadap obat baru.
- Aplikasi: Analisis frequent pattern memiliki berbagai aplikasi, termasuk analisis data keranjang belanja, cross-marketing, desain katalog, analisis kampanye penjualan, analisis log web (clickstream), dan analisis urutan DNA.
- Mengapa Frequent Pattern Mining Penting?
- Memberikan wawasan berharga dari dataset besar.
- Merupakan fondasi untuk banyak tugas data mining penting lainnya, seperti association, correlation, dan causality analysis.
2. Contoh Frequent Itemset Mining
- Itemset: Kumpulan satu atau lebih item. Contoh: {Roti}, {Susu, Telur, Mentega}, {Bir, Popok, Makanan Ringan}.
- K(itemset): Itemset yang berisi k item.
- Support Count: Frekuensi kemunculan itemset dalam dataset.
- Support: Proporsi transaksi yang mengandung itemset.
- Frequent Itemset: Itemset yang support-nya lebih besar dari atau sama dengan nilai minsup (minimum support threshold) yang ditentukan.
- Contoh: Jika minsup = 50%, itemset yang muncul di setidaknya 50% dari total transaksi dianggap sebagai frequent itemset.
3. Association Rule Mining
- Definisi: Association rule adalah implikasi berbentuk X Y, di mana X dan Y adalah itemset yang saling disjoint (tidak memiliki item yang sama), dan X dan Y muncul bersamaan dalam transaksi.
- Contoh: {Diapers} {Beer} (Artinya, pelanggan yang membeli popok cenderung membeli bir juga).
- Metrik untuk Mengukur Kekuatan Aturan:
- Support: Persentase transaksi yang mengandung X Y.
- Confidence: Persentase transaksi yang mengandung X yang juga mengandung Y. Confidence dihitung sebagai support(X Y) / support(X).
- Lift: Rasio antara confidence(X Y) dan support(Y). Lift mengukur seberapa besar kemungkinan Y dibeli ketika X dibeli, sambil memperhitungkan popularitas Y. Lift > 1 menunjukkan korelasi positif, Lift < 1 menunjukkan korelasi negatif, dan Lift = 1 menunjukkan X dan Y independen.
4. Proses Mining Association Rules
- Dua Langkah:
- Temukan semua Frequent Itemsets: Itemset yang memenuhi minimum support.
- Hasilkan Strong Association Rules dari Frequent Itemsets: Aturan yang memenuhi minimum support dan minimum confidence.
5. Contoh Ilustratif
- Dokumen memberikan contoh database transaksi yang digunakan untuk mengilustrasikan konsep frequent itemset dan association rule mining.
Tabel Data Transaksi
Berikut adalah tabel yang merepresentasikan data transaksi yang mungkin digunakan dalam contoh di dokumen (perhatikan bahwa tabel ini mungkin disederhanakan untuk ilustrasi):

Gambar. Tabel Data Transaksi
Penjelasan Tabel:
- Setiap baris mewakili satu transaksi.
- Setiap transaksi memiliki ID unik (misalnya, T100, T200, dst.).
- Kolom "Items Bought" mencantumkan item-item yang dibeli dalam transaksi tersebut. Item direpresentasikan dengan kode (misalnya, I1, I2, I3, dst.).
Contoh Analisis menggunakan Tabel:
- Support dari {I1}: I1 muncul dalam 6 dari 9 transaksi, jadi support({I1}) = 6/9 = 66.67%.
- Support dari {I2, I3}: {I2, I3} muncul dalam 3 dari 9 transaksi, jadi support({I2, I3}) = 3/9 = 33.33%.
- Jika minsup ditetapkan pada 30%, maka {I1} dan {I2, I3} adalah frequent itemsets karena support mereka di atas ambang batas.
- Confidence dari {I1} {I2}: {I1, I2} muncul dalam 4 transaksi (T100, T400, T800, T900). I1 muncul dalam 6 transaksi. Jadi, confidence({I1} {I2}) = 4/6 = 66.67%.
Beri Komentar
Belum ada komentar. Jadilah yang pertama untuk memberikan komentar!