Mohon tunggu...
Valentine Eman
Valentine Eman Mohon Tunggu... Pelajar Sekolah - Mahasiswa

Mahasiswa

Selanjutnya

Tutup

Ilmu Alam & Tekno

Mendalami Proses KDD (Knowledge Discovery in Databases) Data Mining

20 September 2022   13:16 Diperbarui: 20 September 2022   13:41 523
+
Laporkan Konten
Laporkan Akun
Kompasiana adalah platform blog. Konten ini menjadi tanggung jawab bloger dan tidak mewakili pandangan redaksi Kompas.
Lihat foto
Bagikan ide kreativitasmu dalam bentuk konten di Kompasiana | Sumber gambar: Freepik

Berbagai macam kegiatan dilakukan masing-masing orang, mulai dari bertransaksi hingga menghibur diri, semuanya bisa dilakukan melalui aplikasi dan akses internet.

Hal tersebut meninggalkan jejak digital yang tersimpan melalu platform yang mempunyai kapasistas yang besar. Kebiasaan pengguna dapat diketahui melalu proses yang dinamakan data mining atau penggalian data. Tapi kali ini saya tidak akan membahas penjelasan mengenai pengertian data mining secara spesifik hanya saja saya akan menjelaskan mengenai salah satu proses yang terdapat dalam data mining yaitu KDD atau Knowledge discovery in databases.

Data mining adalah sebuah kegiatan untuk mengidentifikasi beragam jenis data. Dari banyaknya data yang tersimpan di database, data-data tersebut diidentifikasi baik dicari kemungkinan adanya pola ataupun lainnya yang dianggap berpotensi untuk menghasilkan sesuatu yang bisa dipakai oleh organisasi atau perusahaan yang memiliki database tersebut.

Data mining itu sendiri meiliki beragam metode yang bisa digunakan yaitu KDD, CRISP-DM, SEMMA, dll. Setiap proses memiliki metode yang berbeda-beda dalam pencarian informasi penting yang ada di dalam database orgnisasi. Pada artikel ini kita akan membahas KDD atau Knowledge Discovery in Database Process.

Knowledge Discovery in Database Process (KDD) adalah salah satu metode yang bisa digunakan dalam melakukan data mining. Fayyed et al. (1996) mendefinisikan KDD sebagai proses dari menggunakan metode data mining untuk mencari informasi-informasi yang berharga, pola yang ada di dalam data, yang melibatkan algoritma untuk mengidentifikasi pola pada data. 

Dunham (2003) meringkas proses KDD dari berbagai step, yaitu: seleksi data, pra-proses data, transformasi data, data mining, dan yang terakhir interpretasi dan evaluasi. Berikut adalah ilustrasi serta penjelasan menegenai proses KDD secara detail:

  1. Data Cleansing, Proses dimana data diolah lalu dipilih data yang dianggap bisa dipakai.
  2. Data Integration, Proses menggabungkan data yang dianggap berulang akan digabungkan menjadi satu.
  3. Selection, Proses seleksi atau pemilihan data yang dianggap relevan terhadap analisis.
  4. Data Trasnformation, Proses transformasi data terpilih ke dalam bentuk mining procedure.
  5. Data Mining, Proses dimana dilakukan beragam teknik untuk mengekstrak pola-pola potensial menghasilkan data yang berguna.
  6. Pattern Evolution, Proses dimana pola-pola yang telah diidentifikasi berdasarkan measure yang diberikan.
  7. Knowledge Presentation, Proses paling akhir dari proses KDD, Data-data yang sudah diproses divisualisasikan agar lebih mudah dipahami oleh pengguna dan diharapkan bisa diambil Tindakan berdasarkan analisis.

Tahapan proses KDD

- Pembelajaran domain aplikasi

-Integrasi data

-Pembersihan dan preprocessing data

-Meruduksi dan memproyeksi data(temukan fitur yang berguna,reduksi dimensi/variabel)

HALAMAN :
  1. 1
  2. 2
  3. 3
Mohon tunggu...

Lihat Konten Ilmu Alam & Tekno Selengkapnya
Lihat Ilmu Alam & Tekno Selengkapnya
Beri Komentar
Berkomentarlah secara bijaksana dan bertanggung jawab. Komentar sepenuhnya menjadi tanggung jawab komentator seperti diatur dalam UU ITE

Belum ada komentar. Jadilah yang pertama untuk memberikan komentar!
LAPORKAN KONTEN
Alasan
Laporkan Konten
Laporkan Akun