Mohon tunggu...
Mursawal
Mursawal Mohon Tunggu... Mahasiswa

Saya merupakan mahasiswa jurusan teknik informatika angkatan 2022 yang saat ini sedang menempuh perkuliahan untuk semester 6

Selanjutnya

Tutup

Artificial intelligence

Association Rule Pada Data Mining

1 Mei 2025   10:16 Diperbarui: 1 Mei 2025   10:16 253
+
Laporkan Konten
Laporkan Akun
Kompasiana adalah platform blog. Konten ini menjadi tanggung jawab bloger dan tidak mewakili pandangan redaksi Kompas.

Rumus Improvement
Rumus Improvement
Ketiga ukuran ini nantinya akan berguna dalam menentukan interesting association rules, yaitu untuk dibandingkan dengan threshold (batasan) yang ditentukan. Batasan tersebut umumnya terdiri dari min_support, min_cofidence, dan min_ improvement. 

Persoalan association rule mining terdiri dari dua sub persoalan : 

1. Menemukan semua kombinasi dari item, disebut dengan frequent itemsets, yang memiliki support yang lebih besar daripada minimum support. 

2. Gunakan frequent itemsets untuk men-generate aturan yang dikehendaki. Semisal, ABCD dan AB adalah frequent, maka didapatkan aturan AB → CD jika rasio dari support (ABCD) terhadap support (AB) sedikitnya sama dengan minimum confidence. Aturan ini memiliki minimum support karena ABCD adalah frequent.

 B.  Algoritma Apriori

Algoritma  Apriori  adalah  suatu  algoritma dasar   yang   diusulkan   oleh   Agrawal   &   Srikant pada   tahun   1994   untuk penentuanfrequent itemsets untuk aturan asosiasi boolean. Algoritma apriori  termasuk  jenis  aturan  asosiasi  pada data mining.Aturan  yang  menyatakan  asosiasi  antara beberapa  atribut  sering  disebut affinity  analysis atau market basket analysis.Analisis  asosiasi  atau association rule miningadalah teknik data  mining untuk    menemukan    aturan    suatu    kombinasi item. 

Algoritma Apriori yang bertujuan untuk menemukan frequent itemsets dijalankan pada sekumpulan data. Pada iterasi ke-k, akan ditemukan semua itemsets yang memiliki k items, disebut dengan k-itemsets. Tiap iterasi berisi dua tahap. Misal Oracle Data Mining Fk merepresentasikan himpunan dari frequent k-itemsets, dan Ck adalah himpunan candidate k-itemsets (yang potensial untuk menjadi frequent itemsets). Tahap pertama adalah men-generate kandidat, dimana himpunan dari semua frequent (k-1) itemsets, Fk-1, ditemukan dalam iterasi ke-(k-1), digunakan untuk mengenerate candidate itemsets Ck. 

Prosedur generate candidate memastikan bahwa Ck adalah superset dari himpunan semua frequent k-itemsets. Struktur data hash-tree digunakan untuk menyimpan Ck. Kemudian data di-scan dalam tahap penghitungan support. Untuk setiap transaksi, candidate dalam Ck diisikan ke dalam transaksi, ditentukan dengan menggunakan struktur data hash-tree dan nilai penghitungan support dinaikkan. Pada akhir dari tahap kedua, nilai Ck diuji untuk menentukan yang mana dari candidate yang merupakan frequent. Kondisi penghitung (terminate condition) dari algoritma ini dicapai pada saat Fk atau Ck+1 kosong .

 C. Contoh kasus

Berikut ada 8 data transaksi keranjang belanja dari sebuah grosir seperti pada tabel berikut.

Data Transaksi
Data Transaksi
   

HALAMAN :
  1. 1
  2. 2
  3. 3
  4. 4
  5. 5
  6. 6
  7. 7
Mohon tunggu...

Lihat Konten Artificial intelligence Selengkapnya
Lihat Artificial intelligence Selengkapnya
Beri Komentar
Berkomentarlah secara bijaksana dan bertanggung jawab. Komentar sepenuhnya menjadi tanggung jawab komentator seperti diatur dalam UU ITE

Belum ada komentar. Jadilah yang pertama untuk memberikan komentar!
LAPORKAN KONTEN
Alasan
Laporkan Konten
Laporkan Akun