Perbandingan Indeks Validitas Gap Statistic dan Indeks Validitas Silhouette pada K-Means Cluster :Studi Kasus pada Data Penyusunan Kinerja Makro Ekonomi dan Sosial tentang Pembangunan Manusia Jawa Tim

Ratnasari, Dewi (2011) Perbandingan Indeks Validitas Gap Statistic dan Indeks Validitas Silhouette pada K-Means Cluster :Studi Kasus pada Data Penyusunan Kinerja Makro Ekonomi dan Sosial tentang Pembangunan Manusia Jawa Tim. Sarjana thesis, Universitas Brawijaya.

Abstract

K-Means Cluster merupakan metode pengelompokan data non hirarki yang berusaha mempartisi data ke dalam bentuk satu atau lebih cluster, dengan mengasumsikan banyaknya kelompok diketahui dan telah didefinisikan. Validitas cluster perlu dilakukan karena belum ada dasar yang kuat mengenai jumlah kelompok terbaik dalam penentuan jumlah kelompok pada analisis cluster. Tibshirani et al. (2001) dan Pramono (2005) telah melakukan penelitian tentang berbagai metode penentuan jumlah kelompok optimal dengan menggunakan indeks validitas. Pada penelitian ini digunakan indeks validitas Gap Statistic dan indeks validitas Silhouette dalam menentukan jumlah optimum kelompok. Tujuan dari penelitian ini adalah membandingkan indeks validitas Gap Statistic dan indeks validitas Silhouette berdasarkan nilai Cluster Tightness Measure (CTM). Data yang digunakan dalam penelitian ini adalah data Penyusunan Kinerja Makro Ekonomi dan Sosial Jawa Timur tentang Pembangunan Manusia dari Tahun 2005- 2008 dengan 4 variabel penelitian pada sampel berukuran 38. Hasil penelitian yang diperoleh dari keseluruhan hasil pengelompokan menunjukkan bahwa Indeks validitas Silhouette menghasilkan nilai CTM terkecil. Sehingga dapat disimpulkan bahwa indeks validitas Silhouette merupakan indeks validitas yang lebih baik dalam penentuan jumlah cluster optimum dibandingkan indeks validitas Gap Statistic pada metode K-means Cluster. Perbandingan hasil pengelompokan pada indeks validitas Silhouette dengan k=3 dari Tahun 2005 ke Tahun 2008 menunjukkan pergeseran hasil pengelompokan. Pemerintah harus mengarahkan perhatian pada wilayah yang masuk pada kelompok 3. Karena, wilayah yang masuk pada kelompok 3 adalah wilayah yang memiliki indeks kesehatan, indeks pendidikan, daya beli dan Indeks Pembangunan Manusia (IPM) yang paling rendah dibandingkan kelompok yang lain.

Item Type: Thesis (Sarjana)
Identification Number: SKR/MIPA/2011/322/051104946
Subjects: 500 Natural sciences and mathematics > 519 Probabilities and applied mathematics > 519.5 Statistical mathematics
Divisions: Fakultas Matematika dan Ilmu Pengetahuan Alam > Statistika
Depositing User: Unnamed user with email repository.ub@ub.ac.id
Date Deposited: 13 Dec 2011 09:23
Last Modified: 22 Oct 2021 08:01
URI: http://repository.ub.ac.id/id/eprint/152786
[thumbnail of 051104946.pdf]
Preview
Text
051104946.pdf

Download (2MB) | Preview

Actions (login required)

View Item View Item