Algoritma K-Means Clustering dan Contoh Perhitungan Untuk Data Numerik 2 Dimensi (bag. 2)

Table of Contents
Baiklah, bagian 2 ini melanjutkan pembahasan perhitungan K-Means untuk data numerik 2 dimensi pada bagian sebelumnya. Perlu teman-teman ketahui bahwa pada bagian 1 saya sudah menetapkan bahwa nilai fungsi objektif sebesar 1000. Iterasi akan berhenti jika nilai fungsi objektif di bawah ambang batas sebesar 0.1.
Proses perhitungan dimulai dari iterasi 1. Awalnya, dihitung jarak dari setiap data (1-10) terhadap semua centroid yang ada. Dari hasil perhitungan jarak antara setiap data terhadap semua centroid, didapatkan nilai jarak terkecil terhadap satu centroid, maka centroid tersebut disebut sebagai centroid terdekat, dan data akan berafiliasi menjadi cluster dari centroid terdekat. Berikut ini contoh menghitung jarak antara data ke-1 dengan centroid 1,2 dan 3 menggunakan metode euclidean. (data dan centroid sudah saya tunjukkan pada bagian 1).

Gambar 1. Contoh perhitungan jarak antara data ke-1 terhadap semua centroid

Dari perhitungan diatas, dapat diketahui bahwa data ke-1 lebih dekat jaraknya terhadap centroid ke-2. Oleh karena itu data ke-1 mengikuti cluster ke-2. Berdasarkan contoh diatas, ditentukan jarak terdekat pada semua data terhadap centroid. Jarak terdekat menentukan suatu data akan masuk ke cluster 1,2 atau 3.
Gambar 2. Penentuan cluster pada semua data

Setelah dipastikan bahwa data 1 hingga data 10 sudah masuk ke salah satu cluster. Selanjutnya, ditentukan centroid baru berdasarkan data yang tergabung pada setiap clusternya. Dimulai dari cluster 1, terdapat dua data yang tergabung didalamnya (lihat gambar 2). Centroid baru didapatkan dari rata-rata yang diperoleh yaitu 5 dan 1. 

Gambar 3. Pentuan centroid baru untuk cluster 1

Kemudian untuk cluster ke-2, ada 5 data yang tergabung didalamnya (lihat gambar 2). Centroid baru didapatkan dari rata-rata yang diperoleh yaitu 1.6 dan 3.4.

Gambar 4. Penentuan centroid baru untuk cluster 2

Yang terakhir adalah untuk cluster ke-3, ada 3 data yang tergabung didalamnya (lihat gambar 2). Centroid baru didapatkan dari rata-rata yang diperoleh yaitu 3.66667 dan 5.33333.
Gambar 5.  Penentuan centroid baru untuk cluster 3

Rata-rata yang didapatkan dari ketiga cluster tersebut merupakan centroid baru yang didapat. Centroid baru digunakan untuk perhitungan pada iterasi ke-2. 
Gambar 6 Centroid baru dari interasi 1


1 comment

Terima kasih telah mampir di blog kami. Jika ingin menghubungi penulis, silakan kirim pesan via email di kitainformatika@gmail.com atau via WA di 087750503014. Jika mood penulis lagi baik, biasanya fast respon.
Comment Author Avatar
Anonymous
September 20, 2017 at 7:44 AM Delete
Mas itu iterasi berikutnya gmna, berhenti uterasinya samapai dmna?