Data Mining adalah upaya yang dilakukan untuk mengolah data untuk memperoleh pengetahuan yang akan dilakukan untuk melakukan klarifikasi, clustering, prediksi, lalu mencari hubungan keterkaitan ( asosiasi ) yang nantinya akan digunakan untuk memperoleh suatu keputusan.
Dalam membuat keputusan, dibutuhkan Proses Knowledge In Database ( KDD ). Fungsi dari KDD ini adalah agar kita dapat mengetahui terlebih dahulu data yang akan kita olah.
Adapun tahapan-tahapan dalam  KDD dapat dibagi menjadi 7, diantaranya :
1. Data Integration
Pada proses ini hal yang dilakukan adalah menyatukan beberapa data yang akan diolah sehingga bisa memudahkan kita dalam pembuatan data yang terkait.
2. Data Cleaning
Pada proses ini hal yang dilakukan adalah membersihkan data yang tidak akan dipakai sehingga data yang akan digunakan menjadi lebih akurat.
3. Data Selection
Pada proses ini hal yang dilakukan adalah menyeleksi data, yaitu memilih atribut mana yang bisa digunakan dalam membuat dataÂ
4. Data Task-Relevan
Pada proses ini hal yang dilakukan adalah memilih data yang cocok untuk ditambahkan ke dalam data yang akan dibuat.