Mohon tunggu...
Waode SitiNurhalisa
Waode SitiNurhalisa Mohon Tunggu... Mahasiswa - MAHASISWA

Thank you for reading

Selanjutnya

Tutup

Ilmu Alam & Tekno

Algorithm Clafissification Dalam Data Mining

20 Oktober 2022   06:15 Diperbarui: 20 Oktober 2022   06:23 214
+
Laporkan Konten
Laporkan Akun
Kompasiana adalah platform blog. Konten ini menjadi tanggung jawab bloger dan tidak mewakili pandangan redaksi Kompas.


Assalamu'alaikum warahmatullahi wabarokatu...... Sebelumnya kita sudah membahas apa itu data mining, apa itu data, persepsi data, dan proses yang dilakukan KDD, so sob. Sekarang, mari kita bicara tentang algoritma klasifikasi dalam data mining.


Klasifikasi adalah algoritma data mining yang membaca data yang ada dan mengelompokkan data ke dalam kriteria atau kategori tertentu. Algoritma klasifikasi yang umum digunakan termasuk mesin vektor pendukung, pohon desession, dan Naive Bayes. 

Klasifikasi adalah teknik data mining yang mengklasifikasikan data berdasarkan lampirannya pada data sampel. 


Apa itu klasifikasi?
Klasifikasi dalam pengertian umum berarti proses pengelompokan. Ilmu data, pada gilirannya, memahami klasifikasi sebagai pengelompokan data ke dalam kategori sehingga dapat diproses dan dianalisis dengan lebih baik.
Penerapan klasifikasi sebenarnya sangat dekat dengan kehidupan sehari-hari. Salah satunya adalah saat menggunakan email. Email memiliki kategori yang disebut spam. Berisi pesan-pesan yang dianggap tidak penting. Klasifikasi ini digunakan untuk membantu membedakan pesan mana yang spam dan mana yang bukan.
Dalam contoh ini, pengklasifikasi atau pengklasifikasi email dilatih untuk mengenali variabel penanda email spam. Dengan cara ini sistem dapat mengklasifikasikan mana yang spam dan mana yang bukan. Jenis klasifikasi
Setidaknya ada tiga jenis klasifikasi yang biasa digunakan dalam ilmu data.

1. Taksonomi berbasis konten
Jenis klasifikasi ini berbasis konten. Dalam tipe ini, pengelompokan data didasarkan pada tipe konten dari setiap file yang tersedia.
2. Taksonomi berbasis pengguna
Seperti namanya, taksonomi ini berfokus pada pemahaman pengguna, yaitu dalam hal membuat, mengedit, meninjau, atau mendistribusikan data. Dari sana, Anda dapat mengidentifikasi kategori data yang benar. Intinya, pengguna menentukan kategori data yang ada.
3. Klasifikasi berdasarkan konteks
Kami dulu memiliki taksonomi berbasis konten, sekarang taksonomi berbasis konteks. Ini berarti bahwa proses clustering tergantung pada konteks yang terkait dengan data. B. Lokasi, jenis aplikasi yang digunakan, dan bahkan siapa yang membuat data tersebut. 

Contoh algoritma dalam klasifikasi
Klasifikasi membutuhkan algoritma khusus agar dapat berjalan. Berikut adalah beberapa jenis algoritma yang umum digunakan:

1. Regresi logistik
Ini adalah jenis algoritma yang paling dasar dalam proses klasifikasi. Meski demikian, keberadaannya sulit tergantikan. Algoritma ini melakukan klasifikasi data dengan mencari hubungan antara variabel dependen dengan satu (atau lebih) variabel independen. 

2. k tetangga terdekat
Lalu ada algoritma K Nearest Neighbors atau lebih sering disebut KNN. Sederhananya, algoritma ini mengikuti prinsip kesamaan data. Jika ditemukan beberapa kesamaan, data dikelompokkan ke dalam kategori yang sama.
K sendiri di sini berarti jumlah "tetangga" atau data terdekat yang memiliki kesamaan untuk diperhatikan. Coba jalankan algoritme ini dengan nilai K yang berbeda untuk membantu Anda memilih K yang baik. Pilih nilai dengan kesalahan terkecil.
3. Teluk Naif
Naive Bayes adalah algoritma berdasarkan teorema Bayes. Diketahui dalam teorema bahwa asumsi harus berubah secara subyektif ketika fakta baru terungkap. Saat menggunakan Naive Bayes sebagai dasar algoritma, kita berasumsi bahwa keberadaan variabel tertentu di dalam kelas tidak bergantung pada keberadaan variabel lain. Algoritma ini memiliki tiga pengklasifikasi: Bernoulli Naive Bayes, Gaussian Naive Bayes, dan Multinomial Naive Bayes.
4. Pohon keputusan
Pohon keputusan adalah model yang terinspirasi oleh cara kerja neuron di otak manusia. Semua neuron di otak manusia terhubung dan informasi mengalir melaluinya. Jika diindikasikan, pohon keputusan memiliki banyak cabang. Sekarang, cabang mewakili keputusan yang telah dibuat. Di sisi lain, node yang menghubungkan cabang adalah atribut data. Di sisi lain, hasil keputusan diwakili oleh daun. Hasil dapat berupa kategoris (untuk klasifikasi data) atau kontinu (regresi data).

5. Hutan Acak
Akhirnya, ada Hutan Acak. Dapat dikatakan bahwa algoritma ini merupakan kelanjutan dari algoritma pohon keputusan. Hal ini dikarenakan algoritma tersebut memiliki kumpulan pohon keputusan yang mendukung proses klasifikasi data. Oleh karena itu, algoritma ini dapat digunakan untuk analisis regresi selain klasifikasi.

6. Jaringan saraf
Lalu ada algoritma jaringan saraf. Disebut demikian karena algoritmanya menyerupai sistem saraf otak manusia. Jaringan saraf memiliki serangkaian unit input atau output yang saling berhubungan. Setiap sambungan memiliki bobot tertentu. Selama fase pembelajaran, senyawa memperbarui bobotnya sehingga mereka dapat memprediksi kategori data.


Kesimpulan
Klasifikasi dalam ilmu data mengacu pada proses menggunakan nilai-nilai dalam data untuk memprediksi kelas atau kategori data. Algoritma pembelajaran mesin itu sendiri dapat dibagi menjadi dua bidang: pembelajaran terawasi dan pembelajaran tanpa pengawasan. Algoritme pembelajaran yang diawasi mencakup klasifikasi dan, selain klasifikasi, regresi dan prediksi. Algoritma yang digunakan dalam klasifikasi itu sendiri sangat bervariasi. Anda dapat memilih dari regresi logistik, hutan acak, dan banyak lagi. Proses klasifikasi pada dasarnya dilakukan untuk mempermudah analisis data dan tentunya memberikan hasil yang akurat. Dibutuhkan waktu untuk memproses data untuk memberikan informasi yang berguna.  

Mohon tunggu...

Lihat Konten Ilmu Alam & Tekno Selengkapnya
Lihat Ilmu Alam & Tekno Selengkapnya
Beri Komentar
Berkomentarlah secara bijaksana dan bertanggung jawab. Komentar sepenuhnya menjadi tanggung jawab komentator seperti diatur dalam UU ITE

Belum ada komentar. Jadilah yang pertama untuk memberikan komentar!
LAPORKAN KONTEN
Alasan
Laporkan Konten
Laporkan Akun