Mohon tunggu...
Tasya Berlianiswah
Tasya Berlianiswah Mohon Tunggu... Mahasiswa - Mahasiswi Jurusan Teknik Informatika Fakultas Teknik Universitas Halu Oleo

Dream, Believe, and Make it happen

Selanjutnya

Tutup

Ilmu Alam & Tekno

Mengetahui Konsep dan Teknik Data Mining

28 September 2022   01:07 Diperbarui: 28 September 2022   01:19 182
+
Laporkan Konten
Laporkan Akun
Kompasiana adalah platform blog. Konten ini menjadi tanggung jawab bloger dan tidak mewakili pandangan redaksi Kompas.
Lihat foto
Ilmu Alam dan Teknologi. Sumber ilustrasi: PEXELS/Anthony

Dalam data mining, ada 3 teknik yang paling sering disebut atau sudah tidak menjadi asing lagi yaitu klasifikasi, klustering dan asosiasi. Namun sebelum itu, ada beberapa tahap yang untuk melakukan data mining yaitu :

1. Database, kumpulan data yang diambil dari berbagai sumber yang tersimpan di database baik relational ataupun non-relational.

2. Integration, setelah data didapatkan, selanjutnya menyatukan data tersebut atau menyamakan format data secara keseluruhan. Hal ini dilakukan karena data yang dikumpulkan dari tahap database, bisa saja  memiliki format yang berbeda-beda.

3. Cleaning, data yang formatnya telah sama,selanjutnya dilakukan pembersihan. Yang berarti dilakukan perbaikan terhadap data yang formatnya telah sama namun tidak memiliki nilai/ bersifat null atau memuat data yang tidak diperlukan. 

Yang kemudian setelah melalui ketiga proses tersebut, data di simpan di data warehouse. Dari tahap database -> Integration -> Cleaning -> Warehouse, tahapan tersebut disebut tahap Pre-Processing.

4. Selection, data yang berada di warehouse, selanjutnya di seleksi berdasarkan suatu atribut yang  memiliki rujukan atau berdasarkan hasil uji statistik. Hal tersebut biasanya disebut Task-Relevant. Perlu diketahui dalam tahapan ini, data yang ada bisa bertransformasi berdasarkan atribut yang  dibutuhkan dalam memproses data.

5. Data Mining, tahapan ini sudah menggunakan algoritma dalam mengolah data-data tersebut berdasarkan teknik yang dipilih (Klasifikasi,Klustering, Asosiasi)

6. Pattern Evaluation, setelah mengolah data tersebut, maka diperolehlah hasil berupa suatu pola untuk diamati statistik pola tersebut.

7. Knowledge, setelah mengamati pola hasil mengolah data maka di dapatkan suatu informasi atau pengetahuan

Tahapan diatas biasa disebut dengan KDD (Knowledge Discovery in Database). Hal terpenting yang dilakukan dalam data mining yaitu mengetahui data yang akan di mining atau yang akan diolah. Untuk mengetahui data yang akan diolah bisa dengan mengetahui objek data dan tipe atribut, deskripsi statistik dasar data, visualisasi data, dan mengukur kesamaan dan ketidaksamaan suatu data. Atribut, merepresentasikan karakter atau ciri-ciri dari objek data tersebut. Adapun beberapa tipe dari atribut yaitu :

1. Nominal, atribut yang digunakan untuk kategori, keadaan, status perkawinan, pekerjaan atau nama benda.

HALAMAN :
  1. 1
  2. 2
Mohon tunggu...

Lihat Konten Ilmu Alam & Tekno Selengkapnya
Lihat Ilmu Alam & Tekno Selengkapnya
Beri Komentar
Berkomentarlah secara bijaksana dan bertanggung jawab. Komentar sepenuhnya menjadi tanggung jawab komentator seperti diatur dalam UU ITE

Belum ada komentar. Jadilah yang pertama untuk memberikan komentar!
LAPORKAN KONTEN
Alasan
Laporkan Konten
Laporkan Akun