Data mining adalah bagian dari analisis data dan disiplin ilmu data yang digunakan untuk mengekstrak informasi dari kumpulan data yang ada menggunakan berbagai teknik analisis. Data mining juga dikenal dengan istilah Knowledge Discovery in Databases (KDD), knowledge extraction, data atau pattern analysis, data archeology, data dredging, information harvesting, business intelligence, dan lainnya.
Pengelolaan data dengan teknik data mining erat kaitannya dengan proses knowledge discovery (KDD), sebuah sistem yang mencari informasi dari pengelolaan data, dari database ke data mining, dan akhirnya dari pengetahuan yang menguntungkan. Knowledge Discovery (KDD)Process memiliki beberapa tahapan sebagai berikut:
1. Basis Data
Pada tahap ini, data harus dicari dan dikumpulkan. Tahap ini merupakan awal dan salah satu tahap utama dari proses KDD, karena proses tidak dapat dilanjutkan tanpa data.
2. Integrasi Data
Tahap ini menggabungkan atau menggabungkan dua atau lebih bagian data yang dikumpulkan dari sumber database.
3. Data Cleaning
Pada tahap ini, memeriksa data yang digabungkan, memeriksa dan memastikan kelayakan, kesesuaian dan keamanan data yang terkandung dalam dataset, dan memperbaiki dan menghapus data yang tidak perlu.
4. Data werhouse
Β Pada tahap ini, data yang diverifikasi dalam fase pembersihan data dikumpulkan atau digabungkan di lokasi atau gudang data yang disebut werhouse.
5.Data Selection