Mohon tunggu...
septiyani bayu saudi
septiyani bayu saudi Mohon Tunggu... Universitas Halu Oleo

Mahasiswa Teknik Informatika Universitas Halu Oleo

Selanjutnya

Tutup

Pendidikan

Teknik Asosiasi dalam Data Mining : Konsep, Algoritma, Implementasi, Kelebihan dan Kekurangan

29 April 2025   05:29 Diperbarui: 29 April 2025   05:29 61
+
Laporkan Konten
Laporkan Akun
Kompasiana adalah platform blog. Konten ini menjadi tanggung jawab bloger dan tidak mewakili pandangan redaksi Kompas.
Lihat foto
(Sumber : https://bit.ly/4cTXWno )

6.   Hasilkan aturan asosiasi: 

  • Untuk setiap frequent itemset L, hasilkan semua subset non-empty s dari L
  • Untuk setiap subset s, bentuk aturan s (L-s)
  • Hitung confidence untuk setiap aturan
  • Pilih aturan dengan confidence minimum confidence

Algoritma FP-Growth (Frequent Pattern Growth) 

FP-Growth adalah algoritma yang lebih efisien daripada Apriori karena menghindari proses pembangkitan kandidat yang mahal. Algoritma ini menggunakan struktur data yang disebut FP-Tree (Frequent Pattern Tree). 

Keunggulan FP-Growth 

  • Hanya memindai database dua kali (dibandingkan dengan Apriori yang bisa berkali-kali).
  • Menggunakan struktur data yang kompak (FP-Tree).
  • Menggunakan pendekatan divide-and-conquer.

Langkah-langkah Algoritma FP-Growth 

1.   Pemindaian Database Pertama :

  • Hitung support untuk setiap item
  • Buang item yang tidak frequent
  • Urutkan item yang frequent berdasarkan support (dari tinggi ke rendah)

2.   Pembuatan FP-Tree: 

  • Buat node root (null)
  • Untuk setiap transaksi, urutkan item berdasarkan urutan frequent
  • Masukkan transaksi ke dalam tree

3.   Mining FP-Tree: 

  • Untuk setiap item (dari support terendah ke tertinggi)
  • Temukan semua path yang berisi item tersebut
  • Bentuk conditional pattern base
  • Bentuk conditional FP-Tree
  • Lakukan mining secara rekursif pada conditional FP-Tree

Algoritma Eclat (Equivalence Class Transformation) 

Eclat adalah algoritma untuk menemukan frequent itemset yang menggunakan representasi vertikal dari database transaksi. 

Keunggulan Eclat 

  • Menggunakan TID-set (Transaction ID set) untuk representasi data
  • Menghitung support menggunakan operasi intersection
  • Tidak perlu memindai database berkali-kali

Langkah-langkah Algoritma Eclat 

1.   Transformasi Data: 

  • Ubah representasi database dari horizontal ke vertikal
  • Untuk setiap item, simpan set transaksi (TID-set) yang mengandung item tersebut

2.   Mining Frequent Itemset: 

  • Untuk setiap pair item, hitung support menggunakan intersection TID-set
  • Hasilkan frequent 2-itemset
  • Secara rekursif, hasilkan frequent k-itemset dari frequent (k-1)-itemset

Implementasi di Dunia Nyata 

  •  Analisis Keranjang Belanja (Market Basket Analysis)
  • Sistem Rekomendasi Produk
  • Deteksi Fraud

Kelebihan dan Kekurangan Teknik Asosiasi 

Kelebihan Teknik Asosiasi 

  • Mudah Diinterpretasi: Hasil analisis dalam bentuk aturan "jika-maka" yang mudah dipahami.
  • Dapat Menemukan Pola Tersembunyi: Mampu menemukan hubungan yang tidak terlihat secara langsung dalam data.
  • Aplikasi yang Luas: Dapat diterapkan di berbagai domain seperti retail, perbankan, asuransi, kesehatan, dll.
  • Didukung Banyak Tools: Tersedia banyak library dan tools yang mendukung implementasi teknik asosiasi.
  • Tidak Memerlukan Asumsi Statistik: Tidak seperti beberapa teknik statistik yang memerlukan asumsi tertentu.
  • Skalabilitas: Algoritma seperti FP-Growth dan Eclat dapat menangani dataset yang besar dengan baik.
  • Dapat Dikombinasikan dengan Teknik Lain: Dapat diintegrasikan dengan teknik data mining lainnya seperti klasifikasi.

Kekurangan Teknik Asosiasi 

  • Sensitif terhadap Parameter: Hasil sangat bergantung pada parameter seperti minimum support dan minimum confidence.
  • Menghasilkan Terlalu Banyak Aturan: Dapat menghasilkan jumlah aturan yang sangat besar, terutama pada dataset yang besar.
  • Masalah Komputasi: Algoritma Apriori memerlukan banyak memori dan waktu komputasi untuk dataset yang besar.
  • Tidak Mempertimbangkan Urutan: Teknik asosiasi standar tidak mempertimbangkan urutan atau waktu transaksi.
  • Kurang Efektif untuk Data Jarang (Sparse Data): Kinerja menurun pada dataset dengan kepadatan rendah.
  • Hanya Mengidentifikasi Korelasi, Bukan Kausalitas: Aturan asosiasi hanya menunjukkan korelasi, bukan hubungan sebab-akibat.
  • Tidak Menangani Data Numerik dengan Baik: Perlu proses diskretisasi untuk data numerik.

Kesimpulan 

Teknik asosiasi dalam data mining adalah alat yang powerful untuk menemukan hubungan yang menarik dalam data. Dengan algoritma seperti Apriori, FP-Growth, dan Eclat, kita dapat menemukan pola pembelian, perilaku konsumen, dan hubungan antar item yang tidak terlihat secara langsung.

Follow Instagram @kompasianacom juga Tiktok @kompasiana biar nggak ketinggalan event seru komunitas dan tips dapat cuan dari Kompasiana. Baca juga cerita inspiratif langsung dari smartphone kamu dengan bergabung di WhatsApp Channel Kompasiana di SINI

HALAMAN :
  1. 1
  2. 2
  3. 3
Mohon tunggu...

Lihat Konten Pendidikan Selengkapnya
Lihat Pendidikan Selengkapnya
Beri Komentar
Berkomentarlah secara bijaksana dan bertanggung jawab. Komentar sepenuhnya menjadi tanggung jawab komentator seperti diatur dalam UU ITE

Belum ada komentar. Jadilah yang pertama untuk memberikan komentar!
LAPORKAN KONTEN
Alasan
Laporkan Konten
Laporkan Akun