Data Mining adalah upaya yang dilakukan untuk mengolah data untuk memperoleh pengetahuan yang akan dilakukan untuk melakukan klarifikasi, clustering, prediksi, lalu mencari hubungan keterkaitan ( asosiasi ) yang nantinya akan digunakan untuk memperoleh suatu keputusan.
Dalam membuat keputusan, dibutuhkan Proses Knowledge In Database ( KDD ). Fungsi dari KDD ini adalah agar kita dapat mengetahui terlebih dahulu data yang akan kita olah.
Adapun tahapan-tahapan dalam  KDD dapat dibagi menjadi 7, diantaranya :
1. Data Integration
Pada proses ini hal yang dilakukan adalah menyatukan beberapa data yang akan diolah sehingga bisa memudahkan kita dalam pembuatan data yang terkait.
2. Data Cleaning
Pada proses ini hal yang dilakukan adalah membersihkan data yang tidak akan dipakai sehingga data yang akan digunakan menjadi lebih akurat.
3. Data Selection
Pada proses ini hal yang dilakukan adalah menyeleksi data, yaitu memilih atribut mana yang bisa digunakan dalam membuat dataÂ
4. Data Task-Relevan
Pada proses ini hal yang dilakukan adalah memilih data yang cocok untuk ditambahkan ke dalam data yang akan dibuat.
5. Data Mining
Pada proses ini hal yang dilakukan adalah memilih algoritma yang sesuai dengan data yang akan dibuat.
6. Data Pattern Evaluation
Pada proses ini hal yang dilakukan adalah mengevaluasi kembali algoritma yang telah dipilih pada tahapan data mining.
7. Presentasi
Pada proses ini hal yang dilakukan adalah mempresentasikan data yang telah dibuat.