Mohon tunggu...
Esy Anugerah Rahayu Kasim
Esy Anugerah Rahayu Kasim Mohon Tunggu... Mahasiswa - Mahasiswa

I am Esy Anugrah Rahayu Kasim. I am twenty years old. I am a student in Halu Oleo University, Kendari, Southeast Sulawesi, Indonesia. Im majoring Informatics Engineering and now im on my 5th semester.

Selanjutnya

Tutup

Ilmu Alam & Tekno

Use the Knowledge Discovery (KDD) Process and Also Know Your Data in the Data Mining Process

27 September 2022   20:18 Diperbarui: 27 September 2022   20:21 348
+
Laporkan Konten
Laporkan Akun
Kompasiana adalah platform blog. Konten ini menjadi tanggung jawab bloger dan tidak mewakili pandangan redaksi Kompas.
Lihat foto
Ilmu Alam dan Teknologi. Sumber ilustrasi: PEXELS/Anthony

8. Tahap Data Pattern Evaulation, pada tahap ini, data yang telah melalui proses dala data mining kemudian dilakukan evaluasi data. Artinya, data - data tersebut kemudian di lakukan evaluasi atau peninjauan kembali terhadap struktur dan pola data.

9. Tahap Knowledge, pada tahap ini merupakan tahap akhir dalam KDD Process, dimana pada tahap ini  hasil dari tahap sebelumnya yaitu, hasil evaluasi pola data dapat dijadikan sebagai suatu aspek pendukung untuk mengambil keputusan sehingga menghasilkan pengetahuan berupa informasi yang bermanfaat.

Tahap 1-6 adalah tahap awal atau tahap dasar sebelum melakukan tahap inti dari KDD Process atau lebih di kenal dengan tahap Pre-Prosesi. Tahap 7-9 merupakan tahap inti atau tahap utama dalam KDD Process. Akan tetapi, semua tahap ini merupakan tahap yang sangat penting dan saling berkaitan sehingga tidak dapat dipisahkan dan dilewati satu tahap pun.

Dalam proses data mining tentunya kita harus mengenal terlebih dahulu tentang data yang kita kumpulkan untuk di olah menjadi data yang memberikan manfaat dari sebuah informasi dan pengetahuan. Karena pada dasarnya terdapat banyak jenis data seperti data transaksi, data gambar dan lain sebagainya. Ada 4 aspek atau komponen untuk dapat mengenal dan mengetahui tentang sebuah data yang kita miliki, diantaranya sebagai berikut :

1. Objek Data dan Tipe Atribut

  • Objek data , dimana sebuah data yang diperoleh tentunya tidak terlepas dari objek data karena sebuah objek menggambarkan sebuah barang ataupun benda. Contohnya yaitu seperti database pendidikan, tentunya tidak lepas dari objek siswa/i ataupun mahasiswa/i dan juga mengenai nilai dan aspek pendidikan lainnya. 
  • Tipe Atribut, yaitu dimana dalam sebuah data harus memiliki karakteristik  dalam sebuah objek data tersebut seperti nama, alamat, jenis data dan lain sebagainya.

2. Deskripsi Statistik Dasar Data

Untuk dapat mengetahui data yang kita miliki kita perlu mengetahui karakteristik data kita dengan cara data tersebut harus memberikan motivasi, melakukan variasi, tendensi sentral dan penyebaran dan harus di anlisis melalui dispersi data yaitu harus ada median, kuartil, maksimal, minimal , varians, outlier, dan lain sebagainya. Selain itu juga dapat dilakukan dengan analisis kuantilatau boxplot.

3. Visualisasi Data
Data yang kita miliki juga perlu di visualisasi, artinya data tersebut harus memberikan wawasan, gambaran data kualitatif dan kuantitatif yang terpola dan terstruktur untuk analisis kuantitatif sehingga memberikan bukti visual. Dalam visualisasi data terdapat 4 metode yaitu seperti tehnik visualiasi berorientasi piksel, proyeksi geometris, berbasis ikon dan hirarkis agar mampu memberikan data yang lebih kompleks dan terstruktur sehingga mampu memetakan atau memisahkan kedata grafik yanv lebih primitif.

4. Mengukur Persamaan dan Ketidaksamaan Data
Dalam mengenal sebuah data, kita harus melihat dari aspek persamaan dan ketidaksamaannya. Seperti seberapa sama ukuran numerik dari dua objek data, nilai akan lebih tinggi ketika objek data lebih mirip ataupun sama dan juga selalu dalam kisaran 0,1. Begitu juga sebaliknya, kita juga harus mengukur dalam aspek ketidaksamaannya yaitu dilihat dari seberapa bedanya dua objek data tersebut, selain itu itu ukutan data lebih rendah jika objek semakin mirip dan mendekati sama sehingga mendekati ketidaksamaan dalam kisaran 0. Karena kedekatan posisi data akan berbatas pada variasi dan berlandaskan lada kesamaan dan ketidaksamaan sebuah data.

Informasi diatas  merupakan sebagian dari banyaknya hal yang masih berkaitan dengan sebuah data, khusunya mengenai data mining karena dalam pengelolaan data perlu dilakukan secara berulang demi menghasilkan informasi yang bermanfaat. Oleh karena itu, untuk melakukan Knowledge Discovery (KDD) Process, data yang digunakan juga harus dikenal. Artinya data yang kita peroleh harus dipilah dan di kenali guna untuk kelancaran proses pengolahan data dengan tujuan menghasilkan data yang informatif, bermanfaat dan memberikan pengetahuan.

HALAMAN :
  1. 1
  2. 2
Mohon tunggu...

Lihat Konten Ilmu Alam & Tekno Selengkapnya
Lihat Ilmu Alam & Tekno Selengkapnya
Beri Komentar
Berkomentarlah secara bijaksana dan bertanggung jawab. Komentar sepenuhnya menjadi tanggung jawab komentator seperti diatur dalam UU ITE

Belum ada komentar. Jadilah yang pertama untuk memberikan komentar!
LAPORKAN KONTEN
Alasan
Laporkan Konten
Laporkan Akun