Mohon tunggu...
Muhammad Ihsan
Muhammad Ihsan Mohon Tunggu... Mahasiswa - Mahasiswa

Just one word, master it.

Selanjutnya

Tutup

Ilmu Alam & Tekno

Data Mining: Data dan Pengolahannya

27 September 2022   22:08 Diperbarui: 27 September 2022   22:10 124
+
Laporkan Konten
Laporkan Akun
Kompasiana adalah platform blog. Konten ini menjadi tanggung jawab bloger dan tidak mewakili pandangan redaksi Kompas.
Lihat foto
Ilmu Alam dan Teknologi. Sumber ilustrasi: PEXELS/Anthony

Setelah saya memperkenalkan konsep data mining di artikel sebelumnya, dimana pada artikel tersebut juga telah saya paparkan mekanisme dan cara kerja data mining secara mendasar. Di artikel ini, saya akan membawa pemahaman pembaca lebih jauh dan mendalam mengenai cara kerja data mining terutama dalam tahapan beserta proses-proses apa saja yang berjalan pada setiap tahap dari persiapan hingga hasil akhir yang nantinya bisa kita gunakan sebagai acuan dalam mengambil sebuah keputusan.

Sebelum kita melakukan rangkaian proses dari data mining, hal yang paling awal yang harus kita lakukan adalah memiliki data. Singkatnya, tanpa memiliki data apa yang akan kita mining? Jadi terlebih dahulu kita akan mencoba mengenali data yang telah kita peroleh. Biasanya, data set yang ada direpresentasikan kedalam tabel dengan karateristik penting sebagai berikut:

  • Dimensionality. Data-data berada pada dimensi tertentu dan membutuhkan usaha pengolahan lebih besar ketika data set berada peada jumlah dimensi yang lebih besar
  • Sparsity, Kekosongan data pada data set
  • Resolution, Skala yang digunakan pada data yang berpengaruh dalam pencarian pola.
  • Distribution, Penyebaran data dengan jarak dari tiap-tiap data

Dataset dengan representasi 2 dimensi seperti tabel tersusun atas data objects dan attribute. Data Object adalah representasi entitas dari data set yang mana dijelaskan nilainya oleh attribute. Secara sederhana, kita akan mengenali data object adalah baris pada database dan attribute adalah kolom. Dan attribute terbagi lagi jenis-jenisnya, seperti:

  • Nominal,bisa disebut juga kategori atau keadaan, contohnya seperti suku
  • Binary, mewakili keadaan 0 dan 1 berdasarkan keadaannya sehingga hanya ada 2 opsi pada data tersebut. Contohnya gender atau tes medis (positif atau negatif)
  • Ordinal,Memiliki beberapa opsi pada datanya dan juga memiliki urutan seperti rendah, sedang, atau tinggi.

Setelah mengenali data yang kita peroleh selanjutnya kita bisa memulai rangkaian proses Knowledge Discovery in Database, dimana data mining juga menjadi salah satu dari rangkaian proses tersebut. Adapun urutan prosesnya adalah sebagai berikut: Database, kumpulan data-data yang telah kita peroleh; Data Integration, mengumpulkan dan menyusun database tadi dalam satu integritas data yang disebut Data Warehouse;  Data Transformation, mengubah jenis-jenis data sesuai kebutuhan. Rangkaian proses tadi bisa digabung dan dinamakan Tahap Preprocessing.

Adapun rangkaian proses selanjutnya yaitu: Data Selection, pemilihan data yang akan digunakan; Data Mining, proses pengolahan data dengan menggunakan algoritma yang diinginkan; Pattern Evaluation, Pencarian pola berdasarkan algoritma pada proses sebelumnya; Knowledge Evaluation, Visualiasi pola yang telah ditemukan dan memperoleh pengatahuan dari pola tersebut.

Itulah data dan proses lebih rinci dari Data Mining, semoga bermanfaat dan dapat diimplementasikan kedepaannya. Terima Kasih

Mohon tunggu...

Lihat Konten Ilmu Alam & Tekno Selengkapnya
Lihat Ilmu Alam & Tekno Selengkapnya
Beri Komentar
Berkomentarlah secara bijaksana dan bertanggung jawab. Komentar sepenuhnya menjadi tanggung jawab komentator seperti diatur dalam UU ITE

Belum ada komentar. Jadilah yang pertama untuk memberikan komentar!
LAPORKAN KONTEN
Alasan
Laporkan Konten
Laporkan Akun