Association Rule Pada Data Mining Halaman 2

Rumus Improvement

Ketiga ukuran ini nantinya akan berguna dalam menentukan interesting association rules, yaitu untuk dibandingkan dengan threshold (batasan) yang ditentukan. Batasan tersebut umumnya terdiri dari min_support, min_cofidence, dan min_ improvement.

Persoalan association rule mining terdiri dari dua sub persoalan :

1. Menemukan semua kombinasi dari item, disebut dengan frequent itemsets, yang memiliki support yang lebih besar daripada minimum support.

2. Gunakan frequent itemsets untuk men-generate aturan yang dikehendaki. Semisal, ABCD dan AB adalah frequent, maka didapatkan aturan AB → CD jika rasio dari support (ABCD) terhadap support (AB) sedikitnya sama dengan minimum confidence. Aturan ini memiliki minimum support karena ABCD adalah frequent.

B. Algoritma Apriori

Algoritma Apriori adalah suatu algoritma dasar yang diusulkan oleh Agrawal & Srikant pada tahun 1994 untuk penentuanfrequent itemsets untuk aturan asosiasi boolean. Algoritma apriori termasuk jenis aturan asosiasi pada data mining.Aturan yang menyatakan asosiasi antara beberapa atribut sering disebut affinity analysis atau market basket analysis.Analisis asosiasi atau association rule miningadalah teknik data mining untuk menemukan aturan suatu kombinasi item.

Algoritma Apriori yang bertujuan untuk menemukan frequent itemsets dijalankan pada sekumpulan data. Pada iterasi ke-k, akan ditemukan semua itemsets yang memiliki k items, disebut dengan k-itemsets. Tiap iterasi berisi dua tahap. Misal Oracle Data Mining Fk merepresentasikan himpunan dari frequent k-itemsets, dan Ck adalah himpunan candidate k-itemsets (yang potensial untuk menjadi frequent itemsets). Tahap pertama adalah men-generate kandidat, dimana himpunan dari semua frequent (k-1) itemsets, Fk-1, ditemukan dalam iterasi ke-(k-1), digunakan untuk mengenerate candidate itemsets Ck.

Prosedur generate candidate memastikan bahwa Ck adalah superset dari himpunan semua frequent k-itemsets. Struktur data hash-tree digunakan untuk menyimpan Ck. Kemudian data di-scan dalam tahap penghitungan support. Untuk setiap transaksi, candidate dalam Ck diisikan ke dalam transaksi, ditentukan dengan menggunakan struktur data hash-tree dan nilai penghitungan support dinaikkan. Pada akhir dari tahap kedua, nilai Ck diuji untuk menentukan yang mana dari candidate yang merupakan frequent. Kondisi penghitung (terminate condition) dari algoritma ini dicapai pada saat Fk atau Ck+1 kosong .

C. Contoh kasus

Berikut ada 8 data transaksi keranjang belanja dari sebuah grosir seperti pada tabel berikut.

Data Transaksi

HALAMAN :

LIHAT SEMUA

Mohon tunggu...

Lihat Artificial intelligence Selengkapnya

Beri Komentar

Belum ada komentar. Jadilah yang pertama untuk memberikan komentar!

Association Rule Pada Data Mining

support

datamining

algoritma apriori

association rules

new world

artificial intelligence

Artikel Lainnya

LAPORKAN KONTEN

Edi Abdullah, Menjadi Trainer Pada Pelatihan Dasar CPNS OIKN

Pada Lelah Hati Menujumu

Brain Rot: Ancaman pada Generasi Literat dan Cara Mengatasinya (Bagian 1)