Assalamualaikum teman-teman, di pertemuan kali ini saya akan membahasa mengenai klasifikasi algoritma dalam data mining.
Algoritma adalah kumpulan cara-cara atau metode secara sistematis untuk menyelesaikan suatu persoalan. Sedangkan klasifikasi artinya mengelompokkan, jadi algoritma klasifikasi adalah pengelompokkan data yang disusun dengan metode tersistematis berdasarkan aturan yang telah ditetapkan.
Algoritma klasifikasi terbagi atas beberapa macam, diantaranya sebagai berikut :
1. Metode Decision Tree, yaitu algoritma untuk membuat suatu keputusan dengan struktur seperti pohon yang memodelkan kemungkinan hasilnya. Metode ini antara lain seperti C4.5, Credal DT, Credal C4, Adaptive Credal C4.5, CART ID3.
2. Metode Naive Bayes, yaitu metode untuk masalah klasifikasi yang didasarkan pada teorema probabilitas Bayes.
3. Metode K-Nearest Neighbor, adalah salah satu algoritma klasifikasi yang mengelompokkan data dalam bentuk gambar atau label. kNN tidak sama dengan K-Means, dimana K-Means sering digunakan untuk Clustering sementara kNN digunakan untuk klasifikasi.
4. Metode LInear Discriminant Analysis, yaitu salah satu metode untuk mengelompokkan data ke dalam beberapa kelas dengan melakukan pengekstrakkan data dari tingkat tinggi ke tingkat rendah.
5. Logistic Regression, adalah teknik klasifikasi data dengan melakukan analisis data dalam konsep statistika.
Setelah mempelajari algoritma, langkah selanjutnya kita perlu mempelajari pula mode evaluasi dari algoritma yang digunakan. Berikut merupakan model evaluasi yang digunakan :
1. Confusion Matrix, yaitu cara evaluasi klasifikasi data dimana keluarannya berupa dua kelas atau lebih dengan cara melakukan perbandingan data hasil dengan data yang sudah ada sebelumnya.
2. AUC, merupakan area di bawah kurva (ROC). semakin besar auc maka semakin baik variabel yang diteliti dalam memperediksi kejadian.Â