Dalam data mining terdapat banyak teknik penggalian algoritma yang dapat dipilih dan disesuaikan dengan tujuan penambangan dan jenis karakter data. Semua itu memiliki fungsi dan tujuan yang berbeda tergantung pada kebutuhan masing-masing. Dalam pemilihan metode data mining atau pemilihan algoritma harus disesuaikan dengan jenis karakter data, baik nominal maupun numerik. Pada tahap ini pemodelan atau penggunaan algoritma yang tepat untuk digunakan dan dipilih dari beberapa algoritma yang tersedia.
Berikut ini adalah pengelompokan peran utama dalam data mining :
1. EstimasiÂ
Estimasi menyiratkan menemukan parameter optimal menggunakan data historis. Estimasi terkait dengan pembuatan model yaitu menemukan parameter yang paling tepat yang paling menggambarkan distribusi multivariat data historis, misalnya jika kita memiliki lima variabel bebas, X1, X2....X5 dan Y sebagai variabel target. Kemudian, estimasi melibatkan proses menemukan f(x) yang merupakan pendekatan terdekat dari keadaan sebenarnya yang dilambangkan dengan g(θ ).
2. Forecasting
Forecasting merupakan proses mengidentifikasi data numerik yang hilang atau tidak tersedia untuk pengamatan baru.
3. Klasifikasi
Klasifikasi dalam data mining adalah teknik umum yang memisahkan titik data ke dalam kelas yang berbeda. Ini memungkinkan Anda untuk mengatur semua jenis kumpulan data, termasuk kumpulan data yang kompleks dan besar serta yang kecil dan sederhana.
4. Klastering
Klastering adalah pengelompokan objek-objek tertentu berdasarkan karakteristik dan kesamaannya. Sedangkan untuk data mining, metodologi ini membagi data yang paling sesuai dengan analisis yang diinginkan menggunakan algoritma join khusus. Analisis ini memungkinkan suatu objek untuk tidak menjadi bagian atau secara ketat bagian dari sebuah cluster.
5. Asosiasi