Perbandingan Jarak Euclidean, Jarak Korelasi Pearson, Dan Jarak Mahalanobis Pada Analisis Cluster Dengan Data Yang Mengandung Multikolinearitas (Studi Kasus Data Kemiskinan Di Kabupaten Malang).

Saifanah, Firyal Rifdah and Dr. Suci Astutik, S.Si., M.Si. (2022) Perbandingan Jarak Euclidean, Jarak Korelasi Pearson, Dan Jarak Mahalanobis Pada Analisis Cluster Dengan Data Yang Mengandung Multikolinearitas (Studi Kasus Data Kemiskinan Di Kabupaten Malang). Sarjana thesis, Universitas Brawijaya.

Abstract

Analisis cluster adalah teknik analisis yang bertujuan untuk mengelompokkan objek menjadi kelompok sehingga objek dalam satu kelompok memiliki karakteristik yang mirip. Sementara itu, objek antar kelompok memiliki karakteristik yang berbeda. Dalam penelitian ini dilakukan pengelompokan kecamatan di Kabupaten Malang berdasarkan data kemiskinan. Data kemiskinan yang digunakan memiliki masalah multikolinearitas sehingga perlu dilakukan penanganan dengan analisis PCA jika jarak yang digunakan adalah jarak euclidean. Selain itu, penanganan dapat juga menggunakan ukuran jarak mahalanobis dan jarak korelasi pearson. Metode analisis yang digunakan adalah metode linkage meliputi single linkage, complete linkage, dan average linkage. Tujuan penelitian ini adalah membandingkan hasil pengelompokan analisis cluster metode linkage dan menentukan jarak yang terbaik dalam mengelompokkan kecamatan di Kabupaten Malang berdasarkan data kemiskinan. Pemilihan metode terbaik dilihat dari nilai rasio simpangan baku yang paling kecil. Berdasarkan hasil penelitian, pengelompokan dengan metode linkage dan ketiga jarak baik jarak euclidean, jarak mahalanobis, maupun jarak korelasi pearson akan dihasilkan kelompok yang relatif sama. Penggunaan jarak mahalanobis dan jarak korelasi pearson dinilai lebih efisien dibandingkan jarak euclidean karena langkah yang diperlukan untuk jarak tersebut tidak sepanjang jarak euclidean. Metode yang menghasilkan pengelompokan paling baik dalam kasus ini adalah metode average linkage dengan jarak korelasi pearson.

English Abstract

Cluster analysis is a technique aimed at grouping objects into groups so that objects in one group have similar characteristics. Meanwhile, objects between groups have different characteristics. In this study a group of sub-districts in Malang Regency was conducted based on poverty data. The poverty data used has a multicollinearity problem so it needs to be handled with Principal Component Analysis if the distance used is euclidean distance. Mahalanobis distance and pearson correlation distance can also be used to handle multicollinearity. The method used is a linkage method including single linkage, complete linkage, and average linkage. The purpose of this study is to compare the results of clustering analysis of linkage methods and determine the best distance in grouping sub-districts in Malang Regency based on poverty data. The selection of the best method is seen from the value of the smallest standard deviation ratio. Based on the research results, clustering by linkage method and all three distances, either the euclidean distance, mahalanobis distance, or pearson correlation distance will produce relatively equal groups. The use of mahalanobis distance and pearson correlation distance is considered to be more efficient compared to euclidean distance because the steps required for such distance are not as long as the euclidean distance. The method that results the best grouping in this case is the average linkage method with the pearson correlation distance

Item Type: Thesis (Sarjana)
Identification Number: 0522090011
Uncontrolled Keywords: Analisis cluster, jarak, multikolinearitas, Cluster analysis, distance, multicollinearity.
Subjects: 500 Natural sciences and mathematics > 519 Probabilities and applied mathematics > 519.5 Statistical mathematics
Divisions: Fakultas Matematika dan Ilmu Pengetahuan Alam > Statistika
Depositing User: Zainul Mustofa
Date Deposited: 29 Sep 2022 06:47
Last Modified: 29 Sep 2022 06:47
URI: http://repository.ub.ac.id/id/eprint/195161
[thumbnail of DALAM MASA EMBARGO] Text (DALAM MASA EMBARGO)
Firyal Rifdah Saifanah.pdf
Restricted to Registered users only until 31 December 2024.

Download (4MB)

Actions (login required)

View Item View Item