Assalamualaikum warahmatullahi wabarokatuh, kali ini saya akan menuliskan materi selanjutnya tentang data mining. seperti yang kita ketahui, data mining adalah sebuah kegiatan untuk mengekstraksi data menjadi informasi yang bisa digunakan sebagai pengetahuan. adapun seperti yang sudah dijelaskan sebelumnya, output dari kegiatan data mining ini adalah pattern (pola) dan data statistik dari data yang diolah.Â
Adapun data mining sendiri ini dapat digunakan untuk keperluan prediksi, klasifikasi, maupun clustering data.Â
1. Prediksi
Ini adalah sebuah manfaat yang bisa didapat dari data mining.yaitu dengan data mining kita bisa memprediksi data / kejadian selanjutnya berdasarkan analisa pola / statistik data sebelumnya. contohnya yaitu dengan menganalisa kuartal pasar, kita bisa memprediksi kuartal pasar selanjutnya, meskipun hanya berupa prediksi.
2. Klasifikasi
Klasifikasi dapat dilakukan dengan data mining, misalnya dari data berbagai hewan dapat diklasifikasikan berdasarkan spesies, kingdom, dan marganya.
3. Clustering
Klustering ini cukup mirip dengan klasifikasi, namun dalam klustering kita mengelompokkan data ke dalam kelompok yang kita buat sendiri, misalnya dari data nilai ujian mahasiswa kita bisa mengkategorikan mahasiswa ke dalam 3 tingkatan berdasarkan kemampuan akademiknya, yaitu tinggi, sedang, dan rendah.
Adapun untuk datanya sendiri juga dibagi menjadi beberapa jenis, yaitu :Â
1. Nominal
Merupakan jenis data yang tidak mengandung nilai kasta / ranking, contohnya (pekerjaan: guru, pekerjaan: polisi)
2. Binary
Merupakan data yang hanya bisa dikelompokkan menjadi dua, contoh (laki-laki, perempuan)
3. Ordinal
Merupakan data yang mengandung nilai kasta / ranking, contoh (jabatan: CEO, jabatan: marketing staff)
4. Numerik
Merupakan data yang memiliki nilai  yang jelas, misalnya angka (integer dsb.)
Dan salah satu metode yang biasa digunakan dalam data mining yaitu KDDÂ (Knowledge Discovery in Database). KDD ini sendiri terdiri dari beberapa langkah, yaitu :Â
1. Data Cleansing
Merupakan tahap untuk menyortir / memilih data data yang akan digunakan
2. Data Integration
Merupakan tahap menggabungkan data dari berbagai sumber ke dalam satu tempat
3. Selection
Merupakan proses untuk memilah data yang dianggap relevan, serta memperbaiki / mengkonfirmasi data yang bermasalah
4. Data Transformation
Merupakan tahap untuk mengubah data ke dalam satu bentuk / jenis data yang akan digunakan sesuai dengan metodedata mining
5. Data Mining
Merupakan proses mengekstraksi data data yang dianggap berguna
6. Pattern Evaluation
Merupakan tahap evaluasi dari hasil data mining yang dilakukan
7. Knowledge Presentation
Merupakan tahap terakhir, yaitu menampilkan hasil data mining ke dalam bentuk pola (pattern) / statistik lengkap dari data.
Referensi :Â
https://hanj.cs.illinois.edu/bk3/bk3_slidesindex.htm
Follow Instagram @kompasianacom juga Tiktok @kompasiana biar nggak ketinggalan event seru komunitas dan tips dapat cuan dari Kompasiana. Baca juga cerita inspiratif langsung dari smartphone kamu dengan bergabung di WhatsApp Channel Kompasiana di SINI