ANALISIS CLUSTER DENGAN MENGGUNAKAN SPSS

06 Jun 2020 imran Alwi 0 Software Statistika

Dalam artikel kali ini, kita akan membahas tutorial tentang analisis cluster dengan menggunakan spss dalam pengolahan data berdasarkan studi kasus.

ANALISIS CLUSTER DENGAN MENGGUNAKAN SPSS

Tentukan jumlah gerombol dari data pada tabel di atas menggunakan metode berhirarki!!
Gunakan metode K-means dengan 2 gerombol!

METODE BERHIRARKI DENGAN MENGGUNAKAN PROGRAM SPSS    

  • Buka Aplikasi SPSS, setelah itu buat variabel dantipe datanya, seperti gambar di bawah ini

  • Lakukan entri data sesuai dengan studi kasus di atas.

  • Lakukan Transformasi atau standardisasi data tersebut. Klik menu AnalyzeàDescriptives StatisticsàDescriptives. Masukkan Seluruh variabel instrument penilai (dalam hal ini variabel kabupaten tidak dimasukkan karena data bertipe string). Kemudian berikan centang pada "Save standardized values asvariables". Kemudian klik OK.

  • Sehingga muncul output deskriptif statistik. Kemudian pada data view akan terlihat juga hasil dari perhitungan z-score dan hasil z-score inilah yang akan dipakai sebagai dasar analisis cluster. Namun apabila data yang terkumpul tidak mempunyai variabilitas satuan, maka proses analisis cluster dapat langsung dilakukan tanpa terlebih dahulu melakukan transformasi atau standardisasi.

  • Selanjutnya, klik menu AnalyzeàClassifyàHierarchical Cluster. Kemudian masukkan seluruh variabel yang telah distandardisasikan tadi (Z-score) ke dalam kotak Variable(s). pada bagian Label Cases by isi degan variabel Kabupaten sedangkan untuk bagian Cluster pilih Cases, pada bagian Display pilih keduanya yaitu Statistics dan Plots.

  • Kemudian klik button Statistics, berikan centang pada Agglomeration Schdule dan Proximity matrix. Kemudian tekan tombol Continue untuk kembali ke menu utama.

  • Kemudian klik button Plots. Aktifkan pilihan Dendogram, kemudian pada bagian Icicle pilih None. Selanjutnya klik Continue untuk kembali ke menu utama.

  • Kemudian klik button Method. Pada bagian Cluster Method pilih Nearest Neighbor. Pada Measure pilih Euclidean distance dan pada Transform Values pilih Z-score. Lalu tekan tombol Continue untuk kembali ke menu utama. Dari tampilan menu utama, tekan tombol OK. Pada Cluster Methodakan digunakan beberapa metode.

    Hasil Output Dengan Menggunakan Metode Single Linkage

Cluster Membership

Case

5 Clusters

4 Clusters

3 Clusters

2 Clusters

1:Banyuwangi

1

1

1

1

2:Cianjur

1

1

1

1

3:Jember

2

2

2

2

4:Jepara

3

3

3

2

5:Jombang

1

1

1

1

6:Kediri

2

2

2

2

7:Kudus

2

2

2

2

8:Kulonprogo

3

3

3

2

9:Lumajang

1

1

1

1

10:Majalengka

4

1

1

1

11:Pacitan

1

1

1

1

12:Pamekasan

1

1

1

1

13:Pasuruan

5

4

3

2

14:Pati

3

3

3

2

15:Probolinggo

3

3

3

2

16:Rembang

3

3

3

2

17:Serang

3

3

3

2

18:Sleman

2

2

2

2

19:Sukabumi

1

1

1

1

Hasil output di atas menunjukkan pengelompokkan objek pengamatan terhadap 5 cluster yang telah diset di awal. Tidak ada alasan khusus mengapa memilih 5 cluster. Hal ini dilakukan agar hasil lebih terpusat pada 2, 3, 4, atau 5 cluster sehingga mudah dibaca. Misalkan jika digunakan 2 cluster maka Banyuwangi, Cianjur, Jombang, Lumajang, Majalengka, Pacitan, Pamekasan, dan Sukabumi berada pada cluster 1 sedangkan kabupaten lainnya dikelompokkan pada cluster 2. Begitu pula untuk jumlah cluster sebanyak 3, 4 atau 5.

Untuk 5 cluster, diperoleh pengelompokkan yaitu cluster 1 terdiri dari Banyuwangi, Cianjur, Jombang, Lumajang, Pacitan, Pamekasan, dan Sukabumi. Cluster 2 terdiri dari Jember, Kediri, Kudus, dan Sleman. Cluster 3 terdiri dari Jepara, Kulonprogo, Pati, Probolinggo, Rembang, dan Serang. Cluster 4 yaitu Majalengka. Cluster 5 : Pasuruan.

Hasil output di atas merupakan dendogram hasil analisis cluster dengan metode single linkage. Dimana, semakin banyak cluster yang dipilih maka jarak nya semakin kecil. Dari dendogram di atas dengan jarak lebih dari 25 maka diperoleh 1 cluster (tidak terjadi pengelompokkan), sedangkan jika jaraknya 25 maka didapat 2 cluster yaitu cluster 1 terdiri dari Cianjur, Sukabumi, Banyuwangi, Pacitan, Jombang, Lumajang, Pamekasan, dan Majalengka sedangkan kabupaten lainnya masuk ke cluster 2. Hasil ini serupa dengan tabel output sebelumnya (tabel cluster membership) jika yang dipilih adalah 2 cluster. Begitu pula jika kita mengambil jaraknya adalah 20 maka terdapat 3 cluster, dimana cluster 1 terdiri dari Jember, Kediri, Kudus, dan Sleman, cluster 2 terdiri dari Cianjur, Sukabumi, Banyuwangi, Pacitan, Jombang, Lumajang, Pamekasan, dan Majalengka, sedangkan kabupaten sisanya masuk ke cluster 3. Begitu pula untuk jarak lainnya yang menghasilnya jumlah cluster yang kemungkinan berbeda satu sama lain. Semakin banyak cluster yang terbentuk maka jaraknya semakin kecil. Artinya, semakin memiliki kemiripan yang besar di dalam cluster dan memiliki ketidakmiripan antarcluster.

Dalam pengolahan analisis cluster dengan menggunakan spss, dapat dijadikan sebagai catatan bahwa hasil dendogram pada metode hirarki tidak ditentukan jumlah clusternya. Hasil atau output dendogram dengan jumlah cluster tertentu ditentukan oleh jaraknya sampai hanya terbentuk 2 cluster. Pada dendogram di atas, jarak maksimumnya adalah 25 (yaitu hingga hanya terbentuk 2 cluster). Berbeda dengan metode non-hirarki seperti K-Means yang terlebih dahulu sudah ditentukan jumlah clusternya.

METODE TAK BERHIRARKI Dengan Menggunakan Program SPSS

  • Buka Aplikasi SPSS, setelah itu buat variabel dan tipe datanya,

  • Lakukan entri data sesuai dengan studi kasus di atas,

  • Lakukan Transformasi atau standardisasi data tersebut. Klik menu AnalyzeàDescriptives StatisticsàDescriptives. Masukkan Seluruh variabel instrument penilai (dalam hal ini variabel kabupaten tidak dimasukkan karena data bertipe string). Kemudian berikan centang pada "Save standardized values asvariables". Kemudian klik OK.

  • Selanjutnya, klik menu AnalyzeàClassifyàK-Means Cluster. Kemudian masukkan seluruh variabel yang telah distandardisasi ke dalam kotak Variable(s). pada bagian Label Cases by isi degan variabel Kabupaten sedangkan untuk bagian Number of Clusters masukkan angka 2 sesuai dengan perintah dari soal. Klik pilihan SAVE, beri tanda ceklist pada "Cluster Membership". Selanjuitnya pilih OK.

Hasil Output analisis cluster dengan Menggunakan SPSS

 

Seperti yang telah dijelaskan sebelumnya, maka metode non-hirarki adalah metode clustering dimana jumlah cluster nya diketahui. Pada kasus ini jumlah cluster ditentukan sebanyak 2 cluster. Dari output di atas terlihat bahwa banyaknya objek di cluster pertama sebanyak 8 kabupaten sedangkan sisanya (11 kabupaten) dikelompokkan ke cluster 2.

Output Pada Data View :

 

Dari hasil di atas dapat dilihat bahwa :

Cluster 1 : Banyuwangi, Cianjur, Jombang, Lumajang, Majalengka, Pacitan, Pamekasan, dan Sukabumi.

Cluster 2 : Jember, Jepara, Kediri, Kudus, Kulonprogo, Pasuruan, Pati, Probolinggo, Rembang, Serang, dan Sleman.

Itulah beberapa penjelasan dan trik tentang tutorial mengenai analisis cluster dengan menggunakan spss.

 

 

BY: imran Alwi

Artikel terkait

Belum ada komentar, Jadilah yang pertama mengomentari.