Mohon tunggu...
Esy Anugerah Rahayu Kasim
Esy Anugerah Rahayu Kasim Mohon Tunggu... Mahasiswa - Mahasiswa

I am Esy Anugrah Rahayu Kasim. I am twenty years old. I am a student in Halu Oleo University, Kendari, Southeast Sulawesi, Indonesia. Im majoring Informatics Engineering and now im on my 5th semester.

Selanjutnya

Tutup

Ilmu Alam & Tekno

Use the Knowledge Discovery (KDD) Process and Also Know Your Data in the Data Mining Process

27 September 2022   20:18 Diperbarui: 27 September 2022   20:21 348
+
Laporkan Konten
Laporkan Akun
Kompasiana adalah platform blog. Konten ini menjadi tanggung jawab bloger dan tidak mewakili pandangan redaksi Kompas.
Lihat foto
Ilmu Alam dan Teknologi. Sumber ilustrasi: PEXELS/Anthony

Teknologi dan Informasi adalah suatu hal yang sudah lumrah di masyarakat. Pesatnya perkembangan teknologi dan informasi tentunya memberikan pengaruh besar masyarakat dalam kehidupannya, terutama yang berhubungan dengan data. Tidak sedikit segala sesuatu yang berkaitan dengan teknologi dan informasi tentunya selalu menggunakan data sebagai sumber informasinya. Oleh  karena itu, istilah data mining menjadi salah satu tehnik atau cara untuk mengelola sebuah data sebagai sumber informasi yang bermanfaat. Pada penjelasan saya di bawah ini, saya akan membuat kita semua untuk bisa memahami tentang apa sebenarnya data mining itu dan bagaimana aspek - aspek lainnya yang berkaitan dengan data mining? Simak penjelasan saya berikut ini.

Banyak sekali istilah - istilah dalam dunia teknologi dan informasi, terutama dalam hal pengelolaan data. Dalam dunia penelitian dengan menggunakan data dalam jumlah yang tidak besar biasanya dikenal dengan teknik pengelolaan data Kuantitatif maupun Kualitatif. Beda halnya dengan data mining. Data mining dapat diartikan sebagai suatu teknik atau cara untuk mengumpulkan, mengelola, menganilisis dan membuat keputusan sesuai dengan data yang di dapatkan dengan tujuan untuk memberikan pengetahuan dari informasi sesuai dengan hasil yang di peroleh yang dapat memberikan manfaat tentunya.

Sesuai dengan beberapa pendapat dari ahli mengenai definisi dari data mining itu sendiri. Menurut (Suntoro, 2019), data mining adalah proses untuk mendapatkan informasi yang  berguna dari basis data yang besar dan perlu diesktraksi agar menjadi informasi baru dan dapat membantu dalam pengambilan keputusan.

Dalam pengelolaan data dengan menggunakan teknik data mining sangat erat kaitannya dengan Knowledge Discovery (KDD) Process yang merupakan suatu sistem untuk menemukan informasi dari pengelolaan data yang di mulai dari database hingga data mining dan pada akhirnya akan mendapatkan informasi dari pengetahuan yang memberikan manfaat. Knowladge Discovery (KDD) Process dalam prosesnya memiliki beberapa tahapan yaitu diantaranya sebagai berikut :

1.  Tahap Database, pada tahap ini kita harus mencari dan mengumpulkan data. Tahap ini merupakan tahap awal dan salah satu tahap utama dalam KDD Process karena tanpa data proses ini tidak dapat berjalan.

2. Tahap Intergration (Data Intergration), pada tahap ini kita menyatukan atau menggabungkan dua data maupun lebih yang sudah kita kumpulkan dari sumber database.

3. Tahap Data Cleaning , pada tahap ini data yang sudah kita gabungkan kemudian di lakukan pengecekan dan juga memperbaiki dan menghapus data yang tidak di butuhkan dengan cara mengecek dan memastikan kelayakan, kecocokan dan kepastian data yang terdapat dalam dataset.

4. Tahap Data Wethouse, pada tahap ini data yang sudah di lakukan pengecekan kebenaran pada tahap data cleaning kemudian data tersebut dikumpulkan atau digabungkan kedalam suatu tempat atau sebuah gudang data yang disebut dengan Werhouse.

5. Tahap Data Selection , pada tahap ini data yang telah dikumpulkan dalam sebuah Data Werhouse kemudian di seleksi atau dipilih dan harus merupakan data yang relevan yang digunakan untuk proses data mining.

6. Tahap Task-relevan Data , pada tahap ini data yang telah dipilih dan diseleksi pada tahap sebelumnya merupakan data yang relevan atau sesuai.

7. Tahap Data Mining, pada tahap ini data yang sudah relevan tersebut akan diolah, dinalaisis, diekstraksi untuk kemudian dapat membuat keputusan yang berupa informasi yang bermanfaat.

8. Tahap Data Pattern Evaulation, pada tahap ini, data yang telah melalui proses dala data mining kemudian dilakukan evaluasi data. Artinya, data - data tersebut kemudian di lakukan evaluasi atau peninjauan kembali terhadap struktur dan pola data.

9. Tahap Knowledge, pada tahap ini merupakan tahap akhir dalam KDD Process, dimana pada tahap ini  hasil dari tahap sebelumnya yaitu, hasil evaluasi pola data dapat dijadikan sebagai suatu aspek pendukung untuk mengambil keputusan sehingga menghasilkan pengetahuan berupa informasi yang bermanfaat.

Tahap 1-6 adalah tahap awal atau tahap dasar sebelum melakukan tahap inti dari KDD Process atau lebih di kenal dengan tahap Pre-Prosesi. Tahap 7-9 merupakan tahap inti atau tahap utama dalam KDD Process. Akan tetapi, semua tahap ini merupakan tahap yang sangat penting dan saling berkaitan sehingga tidak dapat dipisahkan dan dilewati satu tahap pun.

Dalam proses data mining tentunya kita harus mengenal terlebih dahulu tentang data yang kita kumpulkan untuk di olah menjadi data yang memberikan manfaat dari sebuah informasi dan pengetahuan. Karena pada dasarnya terdapat banyak jenis data seperti data transaksi, data gambar dan lain sebagainya. Ada 4 aspek atau komponen untuk dapat mengenal dan mengetahui tentang sebuah data yang kita miliki, diantaranya sebagai berikut :

1. Objek Data dan Tipe Atribut

  • Objek data , dimana sebuah data yang diperoleh tentunya tidak terlepas dari objek data karena sebuah objek menggambarkan sebuah barang ataupun benda. Contohnya yaitu seperti database pendidikan, tentunya tidak lepas dari objek siswa/i ataupun mahasiswa/i dan juga mengenai nilai dan aspek pendidikan lainnya. 
  • Tipe Atribut, yaitu dimana dalam sebuah data harus memiliki karakteristik  dalam sebuah objek data tersebut seperti nama, alamat, jenis data dan lain sebagainya.

2. Deskripsi Statistik Dasar Data

Untuk dapat mengetahui data yang kita miliki kita perlu mengetahui karakteristik data kita dengan cara data tersebut harus memberikan motivasi, melakukan variasi, tendensi sentral dan penyebaran dan harus di anlisis melalui dispersi data yaitu harus ada median, kuartil, maksimal, minimal , varians, outlier, dan lain sebagainya. Selain itu juga dapat dilakukan dengan analisis kuantilatau boxplot.

3. Visualisasi Data
Data yang kita miliki juga perlu di visualisasi, artinya data tersebut harus memberikan wawasan, gambaran data kualitatif dan kuantitatif yang terpola dan terstruktur untuk analisis kuantitatif sehingga memberikan bukti visual. Dalam visualisasi data terdapat 4 metode yaitu seperti tehnik visualiasi berorientasi piksel, proyeksi geometris, berbasis ikon dan hirarkis agar mampu memberikan data yang lebih kompleks dan terstruktur sehingga mampu memetakan atau memisahkan kedata grafik yanv lebih primitif.

4. Mengukur Persamaan dan Ketidaksamaan Data
Dalam mengenal sebuah data, kita harus melihat dari aspek persamaan dan ketidaksamaannya. Seperti seberapa sama ukuran numerik dari dua objek data, nilai akan lebih tinggi ketika objek data lebih mirip ataupun sama dan juga selalu dalam kisaran 0,1. Begitu juga sebaliknya, kita juga harus mengukur dalam aspek ketidaksamaannya yaitu dilihat dari seberapa bedanya dua objek data tersebut, selain itu itu ukutan data lebih rendah jika objek semakin mirip dan mendekati sama sehingga mendekati ketidaksamaan dalam kisaran 0. Karena kedekatan posisi data akan berbatas pada variasi dan berlandaskan lada kesamaan dan ketidaksamaan sebuah data.

Informasi diatas  merupakan sebagian dari banyaknya hal yang masih berkaitan dengan sebuah data, khusunya mengenai data mining karena dalam pengelolaan data perlu dilakukan secara berulang demi menghasilkan informasi yang bermanfaat. Oleh karena itu, untuk melakukan Knowledge Discovery (KDD) Process, data yang digunakan juga harus dikenal. Artinya data yang kita peroleh harus dipilah dan di kenali guna untuk kelancaran proses pengolahan data dengan tujuan menghasilkan data yang informatif, bermanfaat dan memberikan pengetahuan.

HALAMAN :
  1. 1
  2. 2
Mohon tunggu...

Lihat Konten Ilmu Alam & Tekno Selengkapnya
Lihat Ilmu Alam & Tekno Selengkapnya
Beri Komentar
Berkomentarlah secara bijaksana dan bertanggung jawab. Komentar sepenuhnya menjadi tanggung jawab komentator seperti diatur dalam UU ITE

Belum ada komentar. Jadilah yang pertama untuk memberikan komentar!
LAPORKAN KONTEN
Alasan
Laporkan Konten
Laporkan Akun