Mohon tunggu...
Sitti Nur Haliza
Sitti Nur Haliza Mohon Tunggu... Mahasiswa - Mahasiswa

NIM : E1E120051 || Mahasiswa Teknik Informatika || Universitas Halu Oleo

Selanjutnya

Tutup

Ilmu Alam & Tekno

Pentingnya Data dalam Data Mining

27 September 2022   14:01 Diperbarui: 27 September 2022   14:22 277
+
Laporkan Konten
Laporkan Akun
Kompasiana adalah platform blog. Konten ini menjadi tanggung jawab bloger dan tidak mewakili pandangan redaksi Kompas.

                                                                                                                                     Data.jpg

Dalam proses Data Mining, knowledge didapatkan setelah melalui beberapa tahapan yang dilakukan secara terstruktur terhadap sekumpulan data.  Dapat dipastikan, betapa pentingnya data dalam proses ini. Oleh karena itu, pada artikel kali ini akan membahas dan mengenal data dalam proses Data Mining.

Objek Data dan Tipe Atribut

Data set terdiri dari objek data yang dimana tiap objek data mewakili sebuah entitas. Objek data dideskripsikan oleh atribut, yang jika direprersentasikan dalam bentuk tabel atribut terletak pada kolom sementara objek data terletak pada baris.

Atribut (dengan nama lain dimensions, features, variables) merupakan bagian dari data yang mewakili karakteristik dari objek data. Atribut memiliki beberapa tipe yang berbeda-beda, antara lain sebagai berikut.

  • Nominal berkaitan dengan kategori atau nama-nama suatu benda. Contohnya alamat, hobi dan sebagainya.
  • Binary hanya terdiri dari 2 jenis nilai yaitu 0 dan 1. Dimana 0 berarti 'tidak' dan 1 berarti 'ya'. Binary sendiri terbagi lagi menjadi 2 yaitu  Symmetric binary, dimana outputnya memiliki nilai yang sama penting (contohnya laki-laki & perempuan) sementara asymmetric binary, outputnya tidak memiliki nilai yang sangat penting (contohnya positif & negatif).
  • Ordinal memiliki urutan atau peringkat tetapi besar antar nilai yang berurutan tidak diketahui. Contohnya tingkat kepuasan. seperti tidak puas, netral, puas.
  • Numeric: quantitative bermakna bahwa nilai atribut dapat diukur. Atribut numerik terbagi menjadi interval-scaled yang memiliki nilai yang tetap diantara tiap data interval atau ratio-scaled yang memiliki nilai 0. 

Atribut Diskrit dan Kontinu 

Selain memiliki tipe yang berbeda, atribut juga memiliki jenis yang dibedakan menjadi 2, yaitu sebagai berikut.

  • Diskrit terdiri dari kumpulan nilai yang terbatas atau tak terbatas yang dapat dihitung. Atribut ini sering direpresentasikan dalam bentuk integer.
  • Kontinu terdiri dari bilangan real. Atribut ini sering direpresentasikan dalam bentuk floating-point (desimal).

Similarity and Dissimilarity

Kembali ke objek data, terdapat istilah untuk melihat perbedaan antar objek data, diantaranya:

  • Similarity untuk melihat kemiripan dua objek data. Biasanya menggunakan rentang 0 dan 1 yang jika bernilai lebih tinggi, maka objek data semakin mirip.
  • Dissimilarity untuk melihat ketidakmiripan dua objek data. Biasanya berada pada rentang 0, dimana objek data akan semakin tidak mirip jika bernilai lebih rendah.

Gambar dok. pribadi
Gambar dok. pribadi

HALAMAN :
  1. 1
  2. 2
Mohon tunggu...

Lihat Konten Ilmu Alam & Tekno Selengkapnya
Lihat Ilmu Alam & Tekno Selengkapnya
Beri Komentar
Berkomentarlah secara bijaksana dan bertanggung jawab. Komentar sepenuhnya menjadi tanggung jawab komentator seperti diatur dalam UU ITE

Belum ada komentar. Jadilah yang pertama untuk memberikan komentar!
LAPORKAN KONTEN
Alasan
Laporkan Konten
Laporkan Akun