Mohon tunggu...
0011 Fattah Chaerul Majid
0011 Fattah Chaerul Majid Mohon Tunggu... Lainnya - Pelajar/Mahasiswa

Mahasiswa Teknik Informatika STMIK Widya Pratama Pekalongan

Selanjutnya

Tutup

Ilmu Sosbud

Mengenali Data Sebelum Mengolah Data

28 September 2022   10:01 Diperbarui: 28 September 2022   10:06 248
+
Laporkan Konten
Laporkan Akun
Kompasiana adalah platform blog. Konten ini menjadi tanggung jawab bloger dan tidak mewakili pandangan redaksi Kompas.
Lihat foto
Ilmu Sosbud dan Agama. Sumber ilustrasi: PEXELS

Halo Sobat Kompas, kembali lagi bersama saya Fattah Chaerul Majid. Dalam artikel kali ini saya akan kembali membahas tentang Data Mining. Sebelumnya sudah dijelaskan bahwa Data Mining merupakan sebuah proses pengumpulan data yang diolah menjadi sebuah informasi yang berguna untuk mengambil sebuah keputusan ataupun sebuah pengetahuan. Tentu saja dalam pengolahan data tersebut terdapat berbagai proses, teknik, ketentuan atau cara dalam pengolahan data. Sebelum kita sampai ke tahap tersebut, tentunya kita harus mengenali dan mengetahui data yang akan kita gunakan.

Getting to Know Your Data, memiliki beberapa aspek diantaranya

  • Data Objects. Kumpulan data terdiri dari beberapa objek data. Dari sebuah objek data tersebut mewakili dari sebuah entitas. Sebagai contoh seperti database tentang medis yang berisi data dari pasien dan perawat. Data objek sendiri dideskripsikan oleh atribut.
  • Atribut. Merupakan bidang data yang mewakili karakteristik atau fitur dari objek data. Atribut ini memiliki beberapa jenis antara lain.
  • Nominal, mencakup dari sebuah kategori, sebuah keadaan atau sebuah kata benda yang tidak memiliki perbedaan nilai.
  • Biner, merupakan atribut nominal yang hanya memiliki dua status. Biner ini memiliki dua karakteristik lagi yaitu biner simetris yang kedua hasilnya sama pentingnya misal jenis kelamin. Lalu, biner asimetris yang kedua hasilnya tidak sama pentingnya misal tes medis antara positif dan negatif. Konvensi yang menetapkan satu hasil untuk yang paling penting misal positif HIV
  • Ordinal, merupakan nilai yang memiliki urutan bermakna atau peringkat akan tetapi besarnya antara nilai yang berurutan tidak diketahui. Misal ukuran, nilai, pangkat tentara.
  • Numerik, merupakan atribut yang memiliki nilai bilangan bulat. Misal seperti umur. Atribut numerik juga dibagi menjadi dua yaitu interval dan rasio.

Karakteristik penting dalam Set Data

  • Dimensionality, merupakan karakteristik data set yang mengolah data multidimensional sehingga menyebabkan data yang diolah memiliki dimensi yang besar dan tentunya usaha yang dilakukan juga menjadi semakin besar.
  • Sparsity, merupakan terjadinya titik jarang atau kekosongan dalam data.
  • Resolution, merupakan skala pada data dan resolusi yang berbeda.
  • Distribution, merupakan sifat dari penyebaran data dan sejauh mana jarak dari data tersebut.

Setelah kita mengenal dan mengetahui data yang akan kita pakai. Selanjutnya kita akan melakukan proses Data Mining yang dinamakan dengan KDD (Knowledge Discovery in Database). Diantara proses tersebut sebagai berikut.

  • Database, merupakan data yang akan kita gunakan untuk melakukan mining data.
  • Data Integration, merupakan proses penggabungan data untuk dijadikan satu tempat yang bernama Data Werehouse.
  • Data Cleaning, merupakan proses pembersihan data untuk kembali diperbaiki. Seperti data yang masih tidak lengkap dan data yang ganda.
  • Data Transformation, merupakan proses perubahan data menjadi kategori terntentu.
  • Data Selection, merupakan proses pemilihan data yang akan kita gunakan sesuai dengan kebutuhan.
  • Data Mining, merupakan proses memasukkan metode algoritma dari klasifikasi, kluster, dan asosiasi.
  • Pattern Evaluation, merupakan proses untuk melakukan evaluasi agar mendapatkan pola data yang tepat.
  • Knowledge Presentation, merupakan tahap akhir dimana data yang kita olah dapat divisualisaikan agar pembaca atau penerima data dapat memahami dengan mudah.

Nah itu tadi penjelasan singkat mengenai pengenalan bagaimana cara kita mengetahui data yang akan kita gunakan sebelum kita mengolahnya lebih lanjut. Sampai bertemu kembali Sobat Kompas.

Mohon tunggu...

Lihat Konten Ilmu Sosbud Selengkapnya
Lihat Ilmu Sosbud Selengkapnya
Beri Komentar
Berkomentarlah secara bijaksana dan bertanggung jawab. Komentar sepenuhnya menjadi tanggung jawab komentator seperti diatur dalam UU ITE

Belum ada komentar. Jadilah yang pertama untuk memberikan komentar!
LAPORKAN KONTEN
Alasan
Laporkan Konten
Laporkan Akun