A. Metode Clustering
Clustering adalah proses pembentukan kelompok dari satu set objek fisik atau abstrak ke dalam label/kelas yang serupa. Sebuah kelompok yang terdiri dari sekumpulan data-data yang mirip satu sama lain dan berbeda dengan data-data di kelompok lainnya. Sekumpulan data bisa diperlakukan secara kolektif sebagai satu kelompok dan dapat dianggap sebagai bentuk kompresi data . Tujuan clustering adalah untuk memisahkan data yang bersifat unsupervised
M. Bramer (2007) menjabarkan bahwa clustering adalah pengelompokan bersama data-data yang mirip dan mengelompokkan data yang berbeda dalam kelompok lainya. Clustering membagi data kedalam kelompok-kelompok atau cluster tertentu berdasarkan suatu kemiripan atribut-atribut antar data tersebut [19]. Sedangkan menurut F. Gorunescu (2011), clustering berarti menemukan kelompok (cluster) dari objek-objek, berdasarkan kesamaan (kemiripan), sehingga masing-masing kelompok memiliki kesamaan yang lebih dekat dibandingkan dengan objek dari kelompok yang lainnya.
Pengelompokan data atau clustering memiliki dua tujuan. Pertama adalah pengelompokan yang bertujuan untuk pemahaman, dengan cara pembentukan kelompok yang harus mampu menangkap struktur alamiah data, proses dalam pengelompokan ini hanya merupakn proses awal yang kemudian dilanjutkan dengan peringkasan, pelabelan sehingga akhirnya dapat dimanfaatkan sebagai data latih dalam klasifikasi atau sebagainya. Sedangkan pengelompokan yang kedua bertujuan untuk penggunaan, pengelompokan ini memiliki tujuan utama untuk mencari prototipe atau perwakilan yang represntatif terhadap data suatu kelompok, sehingga dapat memberikan sebuah abstraksi dari setiap objek data dalam kelompok yang diwakilkan.
B. Metode K-Means
K-Means adalah metode yang mempartisi data ke suatu kelompok, dimana data yang berkarakterisitik sama akan terdapat pada satu kelompok, sedangkan data dengan karakteristik berbeda berada dalam kelompok lainnya [12]. K- Means termasuk salah satu pengelompokan data nonherarki, dimana jumlah kelompok sudah ditentukan diawal.
Pengelompokan K-Means dilakukan pada data sebanyak N yang kemudian akan dikelompokkan sebanyak K. Pengelompokan ini untuk meminimalkan fungsi objektif yang diset dalam proses pengelompokan, K-Means berusaha meminimalkan variasi dalam suatu kelompok data, dan memaksimalkan variasi antar kelompok.
Pengelompokan K-Means dilakukan pada data sebanyak N yang kemudian akan dikelompokkan sebanyak K. Pengelompokan ini untuk meminimalkan fungsi objektif yang diset dalam proses pengelompokan, K-Means berusaha meminimalkan variasi dalam suatu kelompok data, dan memaksimalkan variasi antar kelompok.
Tidak ada komentar:
Posting Komentar