Data mining adalah kegiatan yang meliputi pengumpulan, pemakaian data historis untuk menemukan keteraturan, pola, atau hubungan dalam set data berukuran besar. Keluaran dari data mining ini bisa dipakai untuk memperbaiki pengambilan keputusan di masa depan Metode Data Mining. Data mining memiliki peranan yang sangat penting dalam beberapa bidang kehidupan diantaranya yaitu bidang industri, bidang keuangan, cuaca, dan teknologi. Teknik data mining yang berbeda digunakan untuk klasifikasi data ulasan destinasi wisata, seperti menerapkan Support Vector Machine (SVM).
Dalam melakukan pengumpulan informasi tentunya terdapat metode, Metode tersebut akan membantu dalam proses menemukan data. Data mining akan menyediakan perencanaan dari ide hingga implementasi akhir.
1. Proses pengambilan Data
Bagaimana proses pengambilan data? Tadi di atas sudah di jelaskan tentang KDD atau Knowledge discovery (mining) in databases. Dengan KDD tersebut itulah kamu dapat melakukan proses pengambilan data.
- Data Cleansing, Proses di mana data-data yang tidak lengkap, mengandung error dan tidak konsisten di buang dari koleksi data. Ketahui juga data lifecycle management untuk mengetahui tentang pengolahan data.
- Data Integration, Proses integrasi data di mana yang berulang akan di kombinasikan.
- Selection, Proses seleksi atau pemilihan data yang relevan terhadap analisis untuk di terima dari koleksi data yang ada.
- Data Transformation, Proses transformasi data yang sudah di pilih ke dalam bentuk mining procedure melalui cara dan agresi data.
- Data Mining, Proses yang paling penting dimana akan dilakukan berbagai teknik yang di aplikasikan untuk mengekstrak berbagai pola-pola potensial untuk mendapatkan data yang berguna.
- Pattern Evolution, Â Sebuah proses di mana pola-pola menarik yang sebelumnya sudah di temukan dengan identifikasi berdasarkan measure yang telah di berikan
- Knowledge Presentation, Merupakan proses tahap terakhir, Dalam hal ini di gunakan teknik visualisasi yang bertujuan membantu user dalam mengerti dan menginterpretasikan hasil dari penambangan data.
Contoh Praktis : Market Basket Analysis
Studi Kasus:
Dataset: transaksi pembelian di supermarket.
Tujuan: temukan kombinasi produk yang sering dibeli bersama.
Hasil Aturan: