Mohon tunggu...
Zaid HelsinkiPutra
Zaid HelsinkiPutra Mohon Tunggu... Mahasiswa

Saya Zaid Helsinki Putra, saya merupakan seorang mahasiwa jurusan Teknik Informatika. Banyak hal yang saya ingin pelajari dalam kehidupan ini. Saya ingin mengenal lebih dekat diri saya sendiri dengan mengeksplor berbagai hal sehingga membuat saya mampu berkembang dan menjadi orang yang lebih baik ke depannya.

Selanjutnya

Tutup

Pendidikan

Tinjauan Mendalam Teknik Asosiasi dalam Data Mining: Konsep, Algoritma dan Arah Pengembangan

1 Mei 2025   22:55 Diperbarui: 6 Mei 2025   08:17 175
+
Laporkan Konten
Laporkan Akun
Kompasiana adalah platform blog. Konten ini menjadi tanggung jawab bloger dan tidak mewakili pandangan redaksi Kompas.
Lihat foto
Bagikan ide kreativitasmu dalam bentuk konten di Kompasiana | Sumber gambar: Freepik

Dalam era digital saat ini, data tak ubahnya seperti tambang emas. Namun, seperti tambang, data juga harus digali, diolah, dan dianalisis agar menghasilkan nilai. Di sinilah data mining berperan---yakni sebagai alat penggali informasi tersembunyi dari tumpukan data. Salah satu teknik dalam data mining yang paling menarik dan banyak digunakan adalah teknik asosiasi.

Apa Itu Teknik Asosiasi?

Teknik asosiasi dalam data mining digunakan untuk menemukan pola atau hubungan antar-item dalam kumpulan data yang besar, terutama dalam bentuk transaksi. Anda mungkin tidak sadar, tetapi teknik ini sangat berperan dalam memberikan rekomendasi saat Anda berbelanja online. Misalnya, saat Anda membeli sebuah kamera, sistem bisa saja menyarankan memory card atau tripod---dan itu bukan kebetulan, melainkan hasil analisis asosiasi.

Prinsip kerjanya sederhana: jika seseorang membeli item A, maka besar kemungkinan ia juga akan membeli item B. Pola ini kemudian ditentukan berdasarkan dua metrik penting: support (berapa sering kombinasi item muncul di data) dan confidence (seberapa besar kemungkinan seseorang membeli B setelah membeli A).

Memahami Algoritma Asosiasi: Apriori, FP-Growth, dan Apriori-TID

  • Algoritma Apriori

Apriori adalah algoritma klasik dalam teknik asosiasi dan paling banyak digunakan. Ia bekerja secara iteratif: mencari item yang sering muncul (frequent itemsets), kemudian membentuk aturan asosiasi dari kombinasi tersebut berdasarkan minimum support dan confidence.

Langkah-langkah Apriori:

  1. Hitung support semua item tunggal.

  2. Gabungkan item yang memenuhi minimum support untuk membentuk itemset baru.

  3. Ulangi hingga tidak ada lagi kombinasi yang memenuhi syarat.

  4. Hitung confidence dari setiap aturan yang mungkin.

Rumus penting:

  • Support

Menunjukkan seberapa sering kombinasi item muncul dalam seluruh transaksi:

Rumus Support
Rumus Support

Rumus Support
Rumus Support
  • Confidence

Mengukur kepercayaan bahwa pelanggan yang membeli A juga membeli B:

Rumus Confidence
Rumus Confidence
  • Lift Ratio:

Lift adalah ukuran yang menunjukkan seberapa besar hubungan antara dua item dibandingkan dengan kemungkinan acak.  (jika lift > 1, hubungan signifikan). 

Rumus Lift
Rumus Lift
  • Algoritma FP-Growth (Frequent Pattern Growth)

FP-Growth dikembangkan sebagai solusi untuk kelemahan utama Apriori---yaitu keharusan untuk membangkitkan kandidat itemset secara eksplisit, yang sangat mahal secara komputasi jika datanya besar.

Bagaimana cara kerja FP-Growth?

  1. Bangun FP-Tree dari database: struktur pohon yang menyimpan item secara hierarki berdasarkan frekuensi.

  2. Telusuri FP-Tree dari bawah untuk menemukan kombinasi itemset yang sering muncul.

  3. Tidak perlu menghasilkan kandidat seperti pada Apriori.

Kelebihan:

  • Lebih cepat dan hemat memori.

  • Cocok untuk dataset besar.

  • Tidak memerlukan scanning database berulang-ulang.

Contoh Penerapan: Dalam transaksi supermarket, FP-Growth bisa langsung menunjukkan bahwa "sabun + sampo + sikat gigi" sering dibeli bersamaan tanpa harus membandingkan semua kemungkinan kombinasi.

  • Algoritma Apriori-TID

Apriori-TID adalah varian dari Apriori yang memperbaiki efisiensi pada tahap tertentu, terutama saat jumlah itemset menjadi sangat besar.

Perbedaan dengan Apriori:

  • Apriori klasik menyimpan database asli dan mengecek semua transaksi.

  • Apriori-TID mengganti database asli dengan struktur baru (TID-list), yaitu hanya daftar transaksi ID yang mengandung itemset tertentu.

Cara kerja singkat:

  1. Awalnya sama dengan Apriori.

  2. Di setiap iterasi, hanya transaksi yang relevan (berisi itemset yang sedang dihitung) yang akan diperiksa.

  3. Ini mengurangi beban pemrosesan, terutama saat itemset makin panjang.

Kelebihan:

  • Lebih hemat waktu saat iterasi lanjutan.

  • Cocok untuk dataset besar dengan item yang panjang.

Namun, Apriori-TID bisa jadi lebih lambat dari Apriori biasa pada iterasi awal, jadi keunggulannya tergantung struktur data.

Contoh Penerapan Algoritma Apriori (Sederhana & Nyata)

Studi Kasus Minimarket

Misalkan Anda memiliki 5 transaksi penjualan di sebuah minimarket. Data transaksi sebagai berikut:

Transanksi Penjualan
Transanksi Penjualan

Kita ingin mencari pola asosiasi dengan:

  • Minimum support: 60%

  • Minimum confidence: 70%

Langkah 1: Hitung Support 1-Itemset

Total transaksi = 5

Support 1-Itemset
Support 1-Itemset

Semua item lolos minimum support 60%.

Langkah 2: Hitung Support 2-Itemset

Support 2-Itemset
Support 2-Itemset

Hanya Roti & Susu yang lolos minimum support. 

Langkah 3: Hitung Confidence

Kita buat aturan dari kombinasi Roti Susu dan Susu Roti

  • Roti Susu

    • Support(Roti & Susu) = 3

    • Support(Roti) = 4

    • Confidence = 3/4 = 75% 

  • Susu Roti

    • Support(Susu) = 4

    • Confidence = 3/4 = 75%

Langkah 4: Hitung Lift

Hasil Perhitungan Lift 
Hasil Perhitungan Lift 

Interpretasi:

  • Meskipun confidence tinggi (75%), nilai lift < 1, artinya hubungan antara Roti dan Susu terjadi hampir secara acak, tidak terlalu kuat secara statistik.

Hasil Akhir Aturan Asosiasi 

  • Jika membeli Roti kemungkinan besar juga membeli Susu (Confidence: 75%, Lift: 0.9375)

  • Jika membeli Susu kemungkinan besar membeli Roti (Confidence: 75%, Lift: 0.9375)

Mengapa Teknik Ini Menarik?

Menariknya, teknik asosiasi bukan hanya soal meningkatkan penjualan. Dalam kajian yang dilakukan oleh tim peneliti dari Universitas Dian Nuswantoro, ditemukan bahwa asosiasi juga digunakan untuk pengembangan sistem, optimalisasi tata letak produk, hingga memahami preferensi masyarakat.

Lebih lanjut, penelitian tersebut menunjukkan bahwa sebagian besar penelitian menggunakan dataset publik, namun cukup banyak pula yang menggunakan dataset privat karena menyangkut data internal perusahaan. Bidang penjualan masih menjadi ladang utama penerapan teknik ini dengan persentase dominasi mencapai 85% dari total studi yang dianalisis.

Ke Mana Arah Perkembangan Selanjutnya?

Teknik asosiasi, meskipun sudah matang, tetap memiliki ruang untuk berkembang. Salah satunya adalah melalui integrasi dengan teknologi big data dan machine learning yang lebih canggih. Di masa depan, bukan tidak mungkin teknik ini menjadi bagian dari sistem kecerdasan buatan yang dapat secara otomatis menyesuaikan penawaran produk, prediksi kebutuhan pelanggan, hingga personalisasi layanan secara real-time.

Selain itu, ada juga perhatian baru pada efisiensi algoritma. Misalnya:

  • FP-Growth mulai banyak digunakan untuk menghindari proses pembangkitan kandidat yang berat.

  • Apriori-TID cocok digunakan saat transaksi sudah terlalu kompleks dan banyak itemset terlibat.

Kesimpulan

Apriori adalah algoritma sederhana namun efektif untuk menemukan pola pembelian dari data transaksi. Dengan memanfaatkan support, confidence, dan lift, kita bisa mengidentifikasi hubungan antar produk secara lebih akurat.

Saat data semakin besar, algoritma seperti FP-Growth dan Apriori-TID menawarkan kecepatan dan efisiensi yang lebih baik. Mereka membantu proses analisis tanpa harus membangkitkan kombinasi item satu per satu.

Teknik asosiasi bukan hanya alat analisis, tapi juga panduan penting dalam strategi bisnis berbasis data. Di era digital yang penuh informasi, kemampuan membaca pola bukan lagi pilihan, melainkan kebutuhan

Follow Instagram @kompasianacom juga Tiktok @kompasiana biar nggak ketinggalan event seru komunitas dan tips dapat cuan dari Kompasiana. Baca juga cerita inspiratif langsung dari smartphone kamu dengan bergabung di WhatsApp Channel Kompasiana di SINI

HALAMAN :
  1. 1
  2. 2
  3. 3
  4. 4
  5. 5
  6. 6
Mohon tunggu...

Lihat Konten Pendidikan Selengkapnya
Lihat Pendidikan Selengkapnya
Beri Komentar
Berkomentarlah secara bijaksana dan bertanggung jawab. Komentar sepenuhnya menjadi tanggung jawab komentator seperti diatur dalam UU ITE

Belum ada komentar. Jadilah yang pertama untuk memberikan komentar!
LAPORKAN KONTEN
Alasan
Laporkan Konten
Laporkan Akun