Mohon tunggu...
Zahwa Diah A.P
Zahwa Diah A.P Mohon Tunggu... Mahasiswa - Mahasiswa Teknik Informatika

Dream it, Wish it, Do it.

Selanjutnya

Tutup

Pendidikan

Tahapan Data Mining (KDD Process) dan Mengenal Data

26 September 2022   16:17 Diperbarui: 26 September 2022   18:54 1589
+
Laporkan Konten
Laporkan Akun
Kompasiana adalah platform blog. Konten ini menjadi tanggung jawab bloger dan tidak mewakili pandangan redaksi Kompas.
Lihat foto
Bagikan ide kreativitasmu dalam bentuk konten di Kompasiana | Sumber gambar: Freepik

Sebelumnya sudah dibahas mengenai apa itu data mining?. Data mining merupakan proses mencari pengetahuan atau knowledge dari suatu informasi lalu data tersebut diolah. Syarat utama data mining adalah "data". Kita akan mengelompokkan data tersebut menjadi tiga yaitu dengan menggunakan klasifikasi, klaster dan asosiasi yang nantinya kita akan mencari keterkaitan data antara satu sama lain. Jadi, pada proses data mining ini, kita hanya akan melakukan pengelompokkan.

Nah, kali ini kita akan membahas mengenai proses atau tahapan dari salah satu metode data mining yaitu Knowledge Discovery in Database (KDD) Process dan kita juga akan mengenal "data" dalam data mining.

Tahapan Knowledge Discovery in Database (KDD) Process

Adapun tahapan atau proses dari Knowledge Discovery in Database (KDD) Process adalah sebagai berikut.

1. Kita harus mempunyai data terlebih dahulu didalam "Database".

2. Setelah kita mempunyai data di database (yang mana didalam database ini memiliki banyak data dan bermacam -- macam), selanjutnya kita akan menggabungkan atau menyatukan dua atau lebih data (Data Integration) dan nantinya akan disesuaikan dengan formatnya. Misalnya, kita mempunyai data Laki -- laki dan data Perempuan. Data laki -- laki disimbolkan L dan data perempuan disimbolkan P. Jadi, data laki -- laki dan data perempuan tersebut di sesuaikan dengan format simbolnya dan kemudian data tersebut disimpan di gudang data atau data warehouse. Jadi, data integration ini dibuat database yang besar dengan menggabungkan dua atau lebih data sebelumnya.

3. Data Cleaning. Setelah menggabungkan data pada proses sebelumnya, data tersebut akan dibersihkan misalnya ketika ada data yang kosong (null) atau data yang tidak diperlukan. Cleaning atau dibersihkan bukan dalam artian dihapus tetapi dikonfirmasikan bahwa datanya dicari yang benar.

3. 1 Data Transformation yaitu mentransformasikan data. Misalnya, ada data tanggal lahir "12-04-2003" nah yang dibutuhkan adalah umur berarti umurnya 19 tahun. Lalu dikelompokkan misalnya umur 0-5 tahun termasuk kelompok balita, 6-11 tahun termasuk kelompok anak -- anak, 12-25 tahun termasuk kelompok remaja dan seterusnya. Jadi, umur 19 tahun ini termasuk kelompok remaja nah ini yang dinamakan data transformation atau transformasi data.

4. Data Selection yaitu menyeleksi data atribut apa yang digunakan. Jadi, data seleksi ini menyeleksi data -- data yang relevan saja sebelum masuk ke dalam proses selanjutnya.

5. Data Mining. Pada proses ini kita akan memilih algoritma apa yang cocok untuk digunakan pada data kita (pola data akan diekstrak pada proses ini). Ada 3 algoritma yang dapat kita gunakan yaitu klasifikasi, klaster dan asosiasi.

6. Pattern Evaluation atau evaluasi pola yaitu pada proses ini misalnya berapa persen data ini dapat dipercaya (contoh dari data tersebut hasil yang didapatkan 70%).

7. Knowledge merupakan proses paling akhir dan apabila masih ada yang tidak sesuai atau error maka akan mengulang kembali pada proses yang error atau proses sebelumnya.

Mengenal Data (Data Objects and Attribute Types)

HALAMAN :
  1. 1
  2. 2
  3. 3
Mohon tunggu...

Lihat Konten Pendidikan Selengkapnya
Lihat Pendidikan Selengkapnya
Beri Komentar
Berkomentarlah secara bijaksana dan bertanggung jawab. Komentar sepenuhnya menjadi tanggung jawab komentator seperti diatur dalam UU ITE

Belum ada komentar. Jadilah yang pertama untuk memberikan komentar!
LAPORKAN KONTEN
Alasan
Laporkan Konten
Laporkan Akun