Mohon tunggu...
Ilham Setiawan
Ilham Setiawan Mohon Tunggu... Lainnya - Mahasiswa

saya seorang mahasiswa ilmu komputer

Selanjutnya

Tutup

Ilmu Alam & Tekno

Data Mining Day 2: Teori Data Mining

21 September 2022   22:24 Diperbarui: 21 September 2022   22:29 215
+
Laporkan Konten
Laporkan Akun
Kompasiana adalah platform blog. Konten ini menjadi tanggung jawab bloger dan tidak mewakili pandangan redaksi Kompas.
Lihat foto
Ilmu Alam dan Teknologi. Sumber ilustrasi: PEXELS/Anthony

Pengertian Data Mining

Data mining adalah melakukan data mining konten, memilih algoritma yang sesuai untuk penelitian data sesuai topik, dan melakukan data mining. Data mining adalah istilah yang dapat digunakan untuk menggambarkan pencarian pengetahuan dalam database. Data mining adalah proses menggunakan statistik, matematika, kecerdasan buatan dan teknik pembelajaran mesin untuk mengekstrak dan mengidentifikasi informasi yang berguna dan pengetahuan yang relevan dari daftar besar. 

Knowledge Discovery Process and Data Mining

Knowledge Discovery in Databases (KDD) adalah ekstraksi non sepele dari pengetahuan implisit, yang sebelumnya tidak diketahui dan berpotensi berguna dari data. Penambangan data adalah eksplorasi dan analisis data dalam jumlah besar secara berurutan untuk menemukan valid, baru, berpotensi berguna, dan pada akhirnya dapat dimengertipola dalam data. Proses semi-otomatis menganalisis database besar untuk temukan pola yang:
- Valid: Pola-pola yang berlaku secara umum.
- Novel: Kami tidak tahu polanya sebelumnya.
- Berguna: Kita dapat merancang tindakan dari pola.
-- Dapat dimengerti: Kita dapat menafsirkan dan memahami pola-polanya.

Dataset

Data mining tidak pernah dihilangkan dari istilah data, dengan alasan bahwa dalam pengolahan data mining diperlukan kumpulan data untuk memperoleh pengetahuan.
Dalam terminologi aritmatika , dataset adalah kumpulan objek yang berisi properti tertentu atau variabel, di mana untuk objek adalah data individu yang memiliki atribut atau variabel tersebut.

Jenis - Jenis Dataset

jenis dataset terbagi atas tiga jenis , yaitu sebagai berikut :

1. Record Data merupakan data yang terdiri dari sekumpulan record, yang masing - masing record terditri dari satu set atribut tetap.

2. Data Graph adalah data yang mempunyai bentuk grafik yang terdiri dari sejumlah node dan edge.

3. Ordered Data Merupakan data - data yang memperhatikan urutan nilai - nilainya. Yang termaksud dalam data urut merupakan genomic sequence data atau spatio-temporal data.

HALAMAN :
  1. 1
  2. 2
  3. 3
Mohon tunggu...

Lihat Konten Ilmu Alam & Tekno Selengkapnya
Lihat Ilmu Alam & Tekno Selengkapnya
Beri Komentar
Berkomentarlah secara bijaksana dan bertanggung jawab. Komentar sepenuhnya menjadi tanggung jawab komentator seperti diatur dalam UU ITE

Belum ada komentar. Jadilah yang pertama untuk memberikan komentar!
LAPORKAN KONTEN
Alasan
Laporkan Konten
Laporkan Akun