Teknik asosiasi adalah salah satu metode dalam data mining yang bertujuan untuk menemukan pola,hubungan,atau asosiasi yang menarik antara variabel-variabel dalam kumpulan data yang besar.Teknik ini bertujuan untuk mengidentifikasi keterkaitan antara satu item dengan item lainnya yang sering muncul bersama dalam suatu dataset, seperti dalam transaksi penjualan. Salah satu contoh penerapannya adalah pada market basket analysis, yaitu menganalisis barang-barang yang sering dibeli bersamaan oleh pelanggan. Aturan yang ditemukan biasanya berbentuk "jika A terjadi, maka B juga cenderung terjadi," dan dievaluasi menggunakan ukuran seperti support (dukungan), confidence (kepercayaan), dan lift. Secara sederhana,teknik ini mencari hubungan "jika-maka" di antara item dalam database transaksi.
APA ITU DATA MINING?
Data mining adalah proses yang menggunakan teknik statistik, matematika, kecerdasan buatan, dan machine learning untuk mengekstraksi dan mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terkait dari berbagai database besar . Data mining juga dikenal dikenal dengan istilah pattern recognition merupakan suatu algoritma yang digunakan untuk pengolahan data guna menemukan pola yang tersembunyi dari data yang diolah . Data yang diolah dengan teknik data mining ini kemudian menghasilkan suatu pengetahuan baru yang bersumber dari data lama, hasil dari pengolahan data tersebut dapat digunakan dalam menentukan keputusan di masa depan . Data mining juga bisa diartikan sebagai rangkaian kegiatan untuk menemukan pola yang menarik dari data dalam jumlah besar, kemudian data -- data tersebut dapat disimpan dalam database, data warehouse atau penyimpanan informasi. Ada beberapa ilmu yang mendukung teknik data mining diantaranya adalah data analisis, signal processing, neural network dan pengenalan pola
KONSEP DASAR DALAM TEKNIK ASOSIASI
Dalam teknik asosiasi,terdapat beberapa konsep penting yaitu:
1. Itemset : itemset adalah sekumpulan satu atau lebih item yang dikelompokkan bersama dalam satu unit analisis. Itemset bisa terdiri dari hanya satu item (disebut 1-itemset) atau lebih dari satu item (2-itemset, 3-itemset, dan seterusnya, tergantung jumlah item di dalamnya).
2. Support : support adalah ukuran yang menunjukkan seberapa sering sebuah itemset muncul di dalam seluruh kumpulan data transaksi. Support membantu menentukan apakah suatu kombinasi item cukup sering terjadi sehingga layak untuk dianalisis lebih lanjut.
Support untuk itemset X dihitung menggunakan rumus:
SUPPORT(X) = (JUMLAH TRANSAKSI YANG MENGANDUNG X) / (TOTAL TRANSAKSI)
Nilai support biasanya dinyatakan dalam bentuk persentase.