Ketika kita berbicara tentang data mining, kita biasanya membahas penemuan pengetahuan dari data. Untuk mengenal tentang data perlu dibahas karakteristik data, atribut data, dan juga KDD. Menambang data meliputi mengetahui tentang data, menemukan hubungan antar data. Bacalah di sini untuk memiliki pemahaman yang tepat tentang topik dan konsep yang akan saya bicarakan dalam artikel.
Karakteristik DatasetÂ
Ada tiga karakteristik umum Data Set yaitu: Dimensionality, Sparsity, dan Resolution. Kita akan membahas apa sebenarnya artinya satu per satu.
1. Dimensionality
Dimensionality dari dataset adalah jumlah atribut yang dimiliki objek dalam kumpulan data. Dalam kumpulan data tertentu jika ada jumlah atribut yang tinggi (juga disebut dimensionality tinggi), maka dapat menjadi sulit untuk menganalisis kumpulan data tersebut.Â
2. Spartisy.Â
Data sparsity mengacu pada seberapa banyak data yang kita miliki untuk entitas model tertentu. Untuk beberapa kumpulan data, seperti yang memiliki fitur asimetris, sebagian besar atribut suatu objek memiliki nilai 0.
3. Resolution.Â
Pola dalam data tergantung pada tingkat resolusi. Misalnya, variasi tekanan atmosfer pada skala jam mencerminkan pergerakan badai dan sistem cuaca lainnya.Â
Jenis-jenis Atribut dalam Data Mining
Atribut adalah bidang data, mendefinisikan karakteristik dari objek data. Berikut ini jenis-jenis atribut dalam data mining :