4 Ruang Lingkup dalam Data Mining

Table of Contents
Saya nukil dari buku Data Mining: Mengolah Data menjadi Informasi Menggunakan Matlab (Prasetyo, 2014), bahwa ada 4 Pokok Bahasan (ruang lingkup) dalam keilmuan data mining, antara lain: model prediksi (pediction modelling), analisis kluster (cluster analysis), analisis asosiasi (association analysis) serta deteksi anomali (anomaly detection). 

Ilustrasi Data Mining

Keempat pokok bahasan tersebut dijelaskan lebih detil sebagai berikut:

Model Prediksi (Prediction Modelling)
Bahasan ini berkaitan dengan pembuatan sebuah model yang dapat melakukan pemetaan dari himpunan variabel ke setiap targetnya, kemudian menggunakan model tersebut untuk memberikan nilai target pada himpunan baru yang didapat. Model prediksi ini dibedakan menjadi 2 macam, yaitu klasifikasi dan regresi. Bedanya, klasifikasi diperuntukkan untuk variabel target diskret, sedangkan regresi untuk variabel target kontinu. Contoh topik yang menggunakan klasifikasi adalah deteksi penyakit pasien. Dikatakan klasifikasi karena hanya beberapa jenis kemungkinan target yang didapatkan dan tidak melibatkan nilai seri waktu (time series) untuk mendapatkan target nilai akhir. Sementara itu, contoh regresi adalah memprediksi jumlah penjualan yang didapatkan pada 3 bulan ke depan. Dalam hal ini, ada nilai seri waktu yang harus dihitung untuk sampai ke target akhir. 

Analisis Cluster (Cluster Analysis)
Analisis kelompok melakukan pengelompokan data ke dalam sejumlah kelompok berdasarkan kesamaan karakteristik masing-masing data pada kelompok-kelompok yang ada. Contoh topik yang berkaitan dengan bahasan ini adalah mengetahui pola pembelian barang oleh konsumen pada waktu-waktu tertentu. Pola pola ini penting diketahui oleh perusahaan untuk menentukan jadwal promosi. 

Analisis Asosiasi (Association Analysis)
Bahasan ini digunakan untuk menemukan pola yang menggambarkan kekuatan hubungan fitur dalam data. Pola yang ditemukan biasanya merepresentasikan bentuk aturan implikasi antar fitur. Tujuannya adalah untuk menemukan pola yang menarik dengan cara yang efisien. Contoh dalam kehidupan sehari-hari adalah analisis data keranjang belanja. Misalnya jika ibu-ibu datang ke toko membeli sembako seperti beras, besar kemungkinan juga membeli jenis sembako lain seperti minyak dan gula. Tentu lebih kuat hubungan antara beras dan minyak daripada beras dan topi, walaupun barang-barang itu sama-sama dijual di toko tersebut.

Deteksi Anomali (Anomaly Detection)
Bahasan ini berkaitan dengan pengamatan sebuah data dari sejumlah data yang secara signifkan mempunyai karakteristik yang berbeda dari sisa data yang lain. Data yang memiliki karakteristik menyimpang tersebut disebut sebagai outlier. Misalkan perilaku kondisi cuaca yang anomali.    



2 comments

Terima kasih telah mampir di blog kami. Jika ingin menghubungi penulis, silakan kirim pesan via email di kitainformatika@gmail.com atau via WA di 087750503014. Jika mood penulis lagi baik, biasanya fast respon.
Comment Author Avatar
October 14, 2019 at 6:07 PM Delete
Sangar pak...
Comment Author Avatar
October 14, 2019 at 6:44 PM Delete
Semoga selalu semangat kuliah, gan meteora