Analisis Cluster Konsumen Ke-4
METODE NON-HIRARKI
Berbeda dengan metode hirarkikal, prosedur non-hirarkikal
(K-means Clustering) dimulai dengan memilih sejumlah nilai cluster awal sesuai
dengan jumlah yang diinginkan dan kemudian obyek digabungkan ke dalam
cluster-cluster tersebut.
1. Sequential Threshold Procedure
Metode ini melakukan pengelompokan dengan terlebih dahulu
memilih satu obyek dasar yang akan dijadikan nilai awal cluster, kemudian semua
obyek yang ada didalam jarak terdekat dengan cluster ini akan bergabung lalu
dipilih cluster kedua dan semua obyek yang mempunyai kemiripan dimasukkan dalam
cluster ini. Demikian seterusnya hingga terbentuk beberapa cluster dengan
keseluruhan obyek didalamnya.
2. Parallel Threshold Prosedure
Secara prinsip sama dengan prosedur sequential threshold,
hanya saja dilakukan pemilihan terhadap beberapa obyek awal cluster sekaligus
dan kemudian melakukan penggabungan obyek ke dalamnya secara bersamaan.
3. Optimizing
Merupakan pengembangan dari kedua metode diatas dengan
melakukan optimasi pada penempatan obyek yang ditukar untuk cluster lainnya
dengan pertimbangan krteria optimasi.
Teknik partisi (Partitioning Methods) mencakup :
- K-Means Clustering
- Methods based on the trace
Prosedur analisis cluster K-means digunakan untuk
mengelompokkan sejumlah kasus besar yang lebih dari 200 dengan lebih efisien.
Metode ini berdasarkan nearest centroid sorting, yaitu pengelompokan
berdasarkan jarak terkecil antara kasus dengan pusat dari cluster. Teknik ini
membutuhkan jumlah cluster yang ditentukan terlebih dahulu oleh pemakai. Untuk
tujuan tersebut dapat menggunakan analisis hierarkikal dalam menentukan jumlah
cluster. Teknik ini juga dapat digunakan untuk menempatkan data baru untuk
dikelompokkan ke dalam cluster terdekat. Agar hasil cluster dapat digunakan
dengan baik, maka sebaiknya dilakukan tahapan interpretasi dan validasi.
Yang perlu diperhatikan pada tahapan interpretasi adalah
karakteristik yang membedakan masing-masing cluster sehingga kita dapat
memberikan label pada masing- masing cluster tersebut. Dengan demikian perlu
kiranya dispesifikasikan kriteria-kriteria yang mendasari kelompok-kelompok
yang telah terbentuk.
Pada tahap validasi dilakukan pengujian terhadap cluster
yang telah terbentuk. Uji yang dapat dilakukan antara lain dengan membandingkan
hasil yang telah diperoleh dengan algoritma yang berbeda. Sebagai contoh,
apabila pertama kali kita menggunakan algoritma hierarkikal, kemudian dicoba
dengan menggunakan algoritma non hierarkikal dan kemudian dilihat apakah
hasilnya mirip atau tidak. Dengan demikian kita sudah melakukan pengujian
terhadap cluster yang kita bentuk.
Teknik Pengukuran Jarak
- Euclidean Distance
- Squared Euclidean Distance
- Pearson Correlation
- Chebychev
- Block
- Minkowski
- Chi-Square
- Phi-Square
- Hamming
0 Response to "Analisis Cluster Konsumen Ke-4"
Post a Comment