Mohon tunggu...
Endah Sekar Lembayung
Endah Sekar Lembayung Mohon Tunggu... Mahasiswa - Mahasiswa

Hobi Travelling

Selanjutnya

Tutup

Ilmu Alam & Tekno

Teknik, Jenis-Jenis Atribut, dan Karaskteristik Data Mining

26 September 2022   22:20 Diperbarui: 26 September 2022   22:28 1023
+
Laporkan Konten
Laporkan Akun
Kompasiana adalah platform blog. Konten ini menjadi tanggung jawab bloger dan tidak mewakili pandangan redaksi Kompas.
Lihat foto
Ilmu Alam dan Teknologi. Sumber ilustrasi: PEXELS/Anthony

Pada perkuliahan kedua mata kuliah "Data Mining" yang berisi tentang teknik, jenis-jenis atribut dan karakteristik data mining. Berikut penjelasannya.

1. Data Mining

Data mining adalah teknik untuk menemukan pola tertentu dari sekumpulan data berjumlah besar. Dalam sebuah database, pasti memuat data dalam jumlah yang sangat banyak. Data mining berguna untuk mencari dan 'menambang' pola-pola unik dalam data yang ada pada database tersebut. 

Biasanya, metode data mining diterapkan dalam bidang machine learning dan statistika. Hal ini berawal dari semakin meningkatnya kompleksitas kerja komputer. teknik data mining kemudian digunakan sebagai proses pengumpulan dan seleksi data yang lebih praktis. Inilah letak keuntungan data mining yang kemudian diterapkan pada bidang pekerjaan lain selain komputer.

2. Teknik Data Mining

Teknik data mining adalah metode yang dapat diterapkan pada berbagai bidang. Oleh sebab itu, metode ini perlu disesuaikan dengan permasalahan atau kebutuhan penggunanya. Ada tujuh klasifikasi data mining yang dibedakan berdasrkan cara kerjanya, seperti berikut:

  • Tracking Patterns/Sequencing

Teknik data mining yang pertama adalah melacak pola atau aturan persitawa. Teknik ini berfungsi untuk menemukan suatu pola pada serangkaian kejadian (sequence) yang berurutan. Teknik tracking patterns dapat mendeteksi  sesuatu pada interval tertentu, seperti lonjakan permintaan produk ketika weekend atau jumlah orang yang mengunjungi situs Anda saat cuaca tertentu.

  • Classification

Teknik classification memerlukan teknik data mining yang lebih kompleks karena menuntut Anda untuk mengumpulkan seluruh data dari kelas atau kategori tertentu. Teknik merupkan yang paling umum digunakan. Dapat mengaplikasikannya untuk mengelompokkan data berdasarkan label yang digunakan. Misalnya,  berdasarkan informasi finansial dan transaksi, dan dapat mengelompokkan pelanggan menjadi medium low, medium, atau high credit risks.

  • Association

Market basket analysis yang berhubungan dengan pemsaran produk. Analisis keranjang bertujuan untuk mengetahui atau mengidentifikasi produk yang sering dibeli bersamaan oleh pelanggan. Misalnya, ketika membeli snack kentang tertentu, pelanggan juga membeli minuman soda kemasan. Dengan mengetahui kebiasaan pelanggan seperti ini, maka perusahaan juga dapat melabeli produk tertentu sebagai 'people also bought this' pada marketplace.

  • Outlier Detection

Teknik bertujuan untuk mengidentifikasi ketika terjadi anomali pada pola data. Misalnya, ketika Anda biasanya selalu dibeli oleh pelanggan berjenis laki-laki, namun pada suatu minggu dibulan Februari, tiba-tiba terjadi lonjakan pembelian yang dilkukan oleh pelanggan perempuan. Teknik outlier detection berperan untuk menganalisis lonjakan tersebut serta penyebabnya, sehingga Anda dapat memutuskan langkah penjualan selanjutnya.

  • Clustering

Teknik clustering hampir mirip dengan classification, namun memerlukan label atau grup data yang lebih banyak berdasarkan pola kesamaan. Misalnya, Anda ingin mengelompokkan demografi audiens yang berbeda-beda menjadi beberapa grup berdasarkan latar belakang, finansial, atau jumlah pembeliannya ketika berbelanja di toko Anda.

  • Regression

Bertujuan untuk mencari pola milai numeriknya alih-alih kelasnya. Hasil dari teknik ini adalah sebuah fungsi sebagai penentu yang didasarkan pada nilai dari input. Misalnya, Anda dapat menggunakannya untuk menentukan harga propduk berdasarkan faktor lain seperti ketersediaa, permintaan pelanggan, dan kompetitor.

  • Forecasting/Prediction

Teknik data mining yang terakhir bisa dikatakan paling valuable katena bertujuan untuk memprediksi nilai yang akan dicapai pada periode tertentu. Dengan teknik predicition, noise data dan nilai pada periode sebelumnya dijadikan acuan atau dasar dari prediksi.

3. Jenis-Jenis Atribut Data Mining

Atribut adalah bagian data yang mewakili karakteristik atau feature dari objek data. Atribut, dimensi, feature, dan variabel merujuk pada maksud yang sama dan sering digunakan secara bergantian. Atribut merupakan item data yang digunakan dalam data mining. Dalam model prediktif, atribut adalah prediktor yang mempengaruhi hasil yang diberikan. Dalam model deskriptif, atribut adalah item informasi yang analisis untuk pengelompokan atau asosiasi. Berdadasarkan sifat datanya, atribut dapat dikategorikan ke dalam 2 kelompok, yaitu kualitatif dan kuantitatif.

Adapun atribut data yang termasuk kedalam jenis kualitatif, yakni:

  • Nominal adalah jenis atribut yang hanya menyediakan nilai yang cukup untuk membedakan antara satu dengan objek lainnya. Nilai dari atribut nominal adalah nama benda atau dapat juga berupa simbol.
  • Ordinal adalah jenis atribut data yang mengidentifikasikan informasi mengenai suatu tingkat yang menjadikan pembeda dari objek. Nilai dari atribut berupa rangking/tingkatan yang bisa diperbandingkan tingkatannya.
  • Binary adalah jenis atribut yang hanya menyediakan  nilai boolean, yang berisi 2 kemungkinan mutlak, seperti 0 dan 1, benar atau salah, ya atau tidak.

Adapun atribut data yang termasuk ke dalam jenis kuantitatif, yakni:

  • Numerik diwakili oleh bilangan bulat atau bilangan riil. 
  • Diskrit didefinisikan oleh titik-titik kardinal (nilai atau skala yang ditentukan disepakati oleh pengamat).
  • Kontinu dapat memiliki banyak nilai di antara dua titik pengamatan lainnya. Atribut data kontinu bertipe float.

4. Karakteristik Data Mining

  • Data mining berhubungan dengan penemuan sesuatu yang tersembuyi dan pola data tertentu yang tidak diketahui sebelumnya.
  • Data mining biasa memnggunakan data yang sangat besar. Biasanya data yang besar digunakan untuk membuat hasil lebih dipercaya.
  • Data mining berguna membuat keputusan yang kritis, terutama dalam strategi.

Sumber Referensi:

https://hanj.cs.illinois.edu/bk3/bk3_slidesindex.htm

Mohon tunggu...

Lihat Konten Ilmu Alam & Tekno Selengkapnya
Lihat Ilmu Alam & Tekno Selengkapnya
Beri Komentar
Berkomentarlah secara bijaksana dan bertanggung jawab. Komentar sepenuhnya menjadi tanggung jawab komentator seperti diatur dalam UU ITE

Belum ada komentar. Jadilah yang pertama untuk memberikan komentar!
LAPORKAN KONTEN
Alasan
Laporkan Konten
Laporkan Akun