6. Â Hasilkan aturan asosiasi:Â
- Untuk setiap frequent itemset L, hasilkan semua subset non-empty s dari L
- Untuk setiap subset s, bentuk aturan s (L-s)
- Hitung confidence untuk setiap aturan
- Pilih aturan dengan confidence minimum confidence
Algoritma FP-Growth (Frequent Pattern Growth)Â
FP-Growth adalah algoritma yang lebih efisien daripada Apriori karena menghindari proses pembangkitan kandidat yang mahal. Algoritma ini menggunakan struktur data yang disebut FP-Tree (Frequent Pattern Tree).Â
Keunggulan FP-GrowthÂ
- Hanya memindai database dua kali (dibandingkan dengan Apriori yang bisa berkali-kali).
- Menggunakan struktur data yang kompak (FP-Tree).
- Menggunakan pendekatan divide-and-conquer.
Langkah-langkah Algoritma FP-GrowthÂ
1. Â Pemindaian Database Pertama :
- Hitung support untuk setiap item
- Buang item yang tidak frequent
- Urutkan item yang frequent berdasarkan support (dari tinggi ke rendah)
2. Â Pembuatan FP-Tree:Â
- Buat node root (null)
- Untuk setiap transaksi, urutkan item berdasarkan urutan frequent
- Masukkan transaksi ke dalam tree
3. Â Mining FP-Tree:Â
- Untuk setiap item (dari support terendah ke tertinggi)
- Temukan semua path yang berisi item tersebut
- Bentuk conditional pattern base
- Bentuk conditional FP-Tree
- Lakukan mining secara rekursif pada conditional FP-Tree
Algoritma Eclat (Equivalence Class Transformation)Â
Eclat adalah algoritma untuk menemukan frequent itemset yang menggunakan representasi vertikal dari database transaksi.Â
Keunggulan EclatÂ
- Menggunakan TID-set (Transaction ID set) untuk representasi data
- Menghitung support menggunakan operasi intersection
- Tidak perlu memindai database berkali-kali
Langkah-langkah Algoritma EclatÂ
1. Â Transformasi Data:Â
- Ubah representasi database dari horizontal ke vertikal
- Untuk setiap item, simpan set transaksi (TID-set) yang mengandung item tersebut
2. Â Mining Frequent Itemset:Â
- Untuk setiap pair item, hitung support menggunakan intersection TID-set
- Hasilkan frequent 2-itemset
- Secara rekursif, hasilkan frequent k-itemset dari frequent (k-1)-itemset
Implementasi di Dunia NyataÂ
- Â Analisis Keranjang Belanja (Market Basket Analysis)
- Sistem Rekomendasi Produk
- Deteksi Fraud
Kelebihan dan Kekurangan Teknik AsosiasiÂ
Kelebihan Teknik AsosiasiÂ
- Mudah Diinterpretasi: Hasil analisis dalam bentuk aturan "jika-maka" yang mudah dipahami.
- Dapat Menemukan Pola Tersembunyi: Mampu menemukan hubungan yang tidak terlihat secara langsung dalam data.
- Aplikasi yang Luas: Dapat diterapkan di berbagai domain seperti retail, perbankan, asuransi, kesehatan, dll.
- Didukung Banyak Tools: Tersedia banyak library dan tools yang mendukung implementasi teknik asosiasi.
- Tidak Memerlukan Asumsi Statistik: Tidak seperti beberapa teknik statistik yang memerlukan asumsi tertentu.
- Skalabilitas: Algoritma seperti FP-Growth dan Eclat dapat menangani dataset yang besar dengan baik.
- Dapat Dikombinasikan dengan Teknik Lain: Dapat diintegrasikan dengan teknik data mining lainnya seperti klasifikasi.
Kekurangan Teknik AsosiasiÂ
- Sensitif terhadap Parameter: Hasil sangat bergantung pada parameter seperti minimum support dan minimum confidence.
- Menghasilkan Terlalu Banyak Aturan: Dapat menghasilkan jumlah aturan yang sangat besar, terutama pada dataset yang besar.
- Masalah Komputasi: Algoritma Apriori memerlukan banyak memori dan waktu komputasi untuk dataset yang besar.
- Tidak Mempertimbangkan Urutan: Teknik asosiasi standar tidak mempertimbangkan urutan atau waktu transaksi.
- Kurang Efektif untuk Data Jarang (Sparse Data): Kinerja menurun pada dataset dengan kepadatan rendah.
- Hanya Mengidentifikasi Korelasi, Bukan Kausalitas: Aturan asosiasi hanya menunjukkan korelasi, bukan hubungan sebab-akibat.
- Tidak Menangani Data Numerik dengan Baik: Perlu proses diskretisasi untuk data numerik.
KesimpulanÂ
Teknik asosiasi dalam data mining adalah alat yang powerful untuk menemukan hubungan yang menarik dalam data. Dengan algoritma seperti Apriori, FP-Growth, dan Eclat, kita dapat menemukan pola pembelian, perilaku konsumen, dan hubungan antar item yang tidak terlihat secara langsung.
Follow Instagram @kompasianacom juga Tiktok @kompasiana biar nggak ketinggalan event seru komunitas dan tips dapat cuan dari Kompasiana. Baca juga cerita inspiratif langsung dari smartphone kamu dengan bergabung di WhatsApp Channel Kompasiana di SINI