Mohon tunggu...
MUHAMMAD RAHMAT DHYAN F.
MUHAMMAD RAHMAT DHYAN F. Mohon Tunggu... Mahasiswa - MAHASISWA SEMESTER LEWAT PERTENGAHAN

E1E120084

Selanjutnya

Tutup

Ilmu Alam & Tekno

Apa Itu Data Dalam Data Mining dan Proses Data Mining?

28 September 2022   01:36 Diperbarui: 28 September 2022   01:44 471
+
Laporkan Konten
Laporkan Akun
Kompasiana adalah platform blog. Konten ini menjadi tanggung jawab bloger dan tidak mewakili pandangan redaksi Kompas.
Lihat foto
Ilmu Alam dan Teknologi. Sumber ilustrasi: PEXELS/Anthony

Assalamualaikum warahmatullahi wabarakatuh dalam artikel sebelumnya mengenai data mining disini saya akan menjelaskan lanjutan dari artikel sebelumnya. Pada artikel sebelumnya membahas tentang data mining itu sendiri kemudian beberapa metodenya, namun kita perlu ketahui juga bahwa disisi lain data mining ini mengingatkan kita pada pengambilan keputusan keputusan dimana hal itu terjadi pada proses pengkalsifikasian dan juga pada pendeskripsian sebuah data. Nah dalam metode tersebut selalu di barengi dengan proses, untuk itu perlu kita ketahui proses ini dinamakan dengan Knowledge Discovery in Database atau singkatannya adalah KDD.

Sebelum saya membahas lebih dalam tentang yang Namanya KDD yang perlu kita ketahui adalah data itu sendiri. Di dalam data ada yang Namanya atribut , atribut ini merupakan karakter ataupun properti dari objek tertentu. Jenis jenis atribut dalam data yang akan di lakukan data mining adalah sebagai berikut :

  • Nominal adalah kategori kelas yang tidak memiliki perbedaan nilai.
  • Binary adalah atribut yang juga tidak memiliki perbedaan tetapi haya memiliki 2 states, disini seperti pada bilangan biner pada umumnya yang ada 0 dan 1.
  • Numeric  adalah dimana nilainya bersifat  kuantitatif dimana numerik ini memiliki 2 skala yakni interval dan rasio.

Kemudian ada perbedaan diantara atribut yang dinamakan diskrit atribut dan juga continous atribut

Atribut Diskrit

Hanya memiliki kumpulan nilai yang terbatas atau tak terbatas yang dapat dihitung Misalnya, kode pos, profesi, atau kumpulan kata dalam kumpulan dokumen

Atribut Berkelanjutan

Memiliki bilangan real sebagai nilai atribut Misalnya, suhu, tinggi, atau berat. Secara praktis, nilai-nilai nyata hanya dapat diukur dan direpresentasikan dengan menggunakan sejumlah digit yang terbata

Setelah kita ketahui data dalam data mining kemudian ada juga perbedaan diantara data tersebut selanjutnya adalah karakter dari data tersebut yakni :

  • Dimensi adalah properti dari kumpulan data yang memproses data multidimensi, sehingga data yang diproses memiliki dimensi yang besar dan jumlah usaha yang  besar. Hasil  pengolahan data ini, terutama ketika menggunakan pembelajaran mesin untuk mengklasifikasikan data, tidak selalu baik karena  korelasi data yang erat, sehingga upaya sering sia-sia.
  • Sparsity adalah terjadinya sparse point atau gap pada data. Ini bisa terjadi dengan data multidimensi.Resolusi adalah ukuran dari berbagai data dan resolusi. Tingkat resolusi mempengaruhi pola data. Jika resolusinya terlalu kasar, polanya akan hilang dan jika resolusinya terlalu halus, polanya mungkin tidak  terlihat.
  • Dispersi adalah bagaimana data didistribusikan dan seberapa jauh dari data.

Nah itu tadi adalah atribut maupun karakter yang digunakan dalam proses data mining kemudian kita melanjutkan ke KDD. KDD ini sendiri terdiri dari :

  • Database atau basis data merupakan kumpulan data yang nantinya akan diolah.
  • Integrasi data adalah fase menggabungkan potongan-potongan data yang diambil dan menyimpannya di tempat yang sama. Lokasi tersebut disebut "data warehouse".
  • Data cleaning atau Pembersihan data adalah proses pembersihan data – data untuk perbaikan. Data yang dimodifikasi adalah data yang tidak lengkap, data yang bising, data nol, dan data duplikat untuk menghindari redundansi.
  • Transformasi data adalah proses mengubah data ke dalam kategori tertentu.

Dan yang terakhir adalah proses data mining ini bekerja, proses ini dinamakan dengan preprocessing data, adapun tahapannya yaitu :

  • Data selection Pemilihan data adalah proses pemilihan data mana yang akan digunakan sesuai dengan kebutuhan dan tujuan yang ingin dicapai.
  • Data mining adalah proses memasukkan teknik algoritmik atau model pembelajaran mesin (klasifikasi, pengelompokan, asosiasi).
  • Pattern evaluation Evaluasi pola adalah proses  evaluasi untuk mendapatkan pola yang tepat jika diperlukan.
  • Knowledge presentation Penyajian pengetahuan merupakan tahap akhir dari KDD, dimana  data yang  diolah oleh algoritma/machine learning ditampilkan atau divisualisasikan agar mudah dipahami oleh pembaca/pengguna, misalnya dalam bentuk grafik.

Mungkin itu saja yang bisa saya sampaikan pada artikel ini jika ada kesalahan kata dalam artikel ini mohon dimaafkan karena kesalahan milik saya sepenuhnya dan kebenaran adalah milik allah swt sekian terima kasih.

HALAMAN :
  1. 1
  2. 2
Mohon tunggu...

Lihat Konten Ilmu Alam & Tekno Selengkapnya
Lihat Ilmu Alam & Tekno Selengkapnya
Beri Komentar
Berkomentarlah secara bijaksana dan bertanggung jawab. Komentar sepenuhnya menjadi tanggung jawab komentator seperti diatur dalam UU ITE

Belum ada komentar. Jadilah yang pertama untuk memberikan komentar!
LAPORKAN KONTEN
Alasan
Laporkan Konten
Laporkan Akun