Perbandingan Jarak Euclidean Dan Manhattan Pada Analisis Cluster Hierarki Dan K-Means

Akbar, Dwi Amri Rizqi and Dwi Ayu Lusia,, S.Si., M.Si. (2022) Perbandingan Jarak Euclidean Dan Manhattan Pada Analisis Cluster Hierarki Dan K-Means. Universitas Brawijaya, 052309, p. 69.

Abstract

Clustering merupakan aktivitas atau task yang memiliki tujuan mengelompokkan informasi yang memiliki kemiripan karakteristik antara satu informasi dengan informasi lainnya ke dalam cluster atau kelompok. Terdapat sejumah metode yang dapat digunakan untuk pengelompokan diantaranya metode hierarki dan metode non-hierarki salah satunya K-Means. Metode tersebut digunakan untuk mengukur jarak Euclidean dan Manhattan. Dari kedua metode tersebut dapat diketahui perbandingan konsep jarak antara Euclidean dan Manhattan. Penelitian ini bertujuan membandingkan konsep jarak Euclidean dengan jarak Manhattan pada metode analisis cluster hierarki dan analisis cluster K-Means. Data yang digunakan pada penelitian ini merupakan data simulasi atau data bangkitan. Variabel yang digunakan pada penelitian ini menggunakan 3 variabel dengan rata-rata 0 dan sigma sama dengan 1. Data pada penelitian ini diolah menggunakan Ms. Excel dan software statistik RStudio. Berdasarkan hasil analisis, diketahui bahwa metode terbaik dari semua metode cluster yang telah dijalankan adalah cluster hierarchical average linkage jarak manhattan dengan hasil indeks Silhouette, Connectivity dan Dunn pada metode menghasilkan hasil yang paling optimal. Nilai indeks Silhouette pada metode ini sebesar 0,3880 banyak cluster 2, indeks Connectivity sebesar 13,8853 banyak cluster 2 dan indeks Dunn sebesar 0,1300 banyak cluster 6. Jumlah cluster paling optimal pada penelitian ini adalah sebanyak 2 cluster.

English Abstract

Clustering is an activity or task with the aim for grouping information that has similar characteristics between one and another information into clusters or groups. There are a number of methods that can be used for grouping, including hierarchical methods and nonhierarchical methods; one of them is K-Means. This method is used to measure Euclidean and Manhattan distances. From these two methods, it can be seen the comparison of the concept of distance between Euclidean and Manhattan. This study aims to compare the concept of Euclidean distance with Manhattan distance in the method of hierarchical cluster analysis and K-Means cluster analysis. The data used in this research is simulation data or generation data. The variables used in this study using 3 variables with an average of 0 and sigma equal to 1. The data in this study were processed using Ms. Excel and RStudio statistical software. Based on the results of the analysis, it is known that the best method of all the cluster methods that have been carried out is the hierarchical average linkage cluster of Manhattan distance with the results of the Silhouette, Connectivity and Dunn indexs in the method producing the most optimal results. The Silhouette index value in this method is 0.3880 for 2 clusters, Connectivity index is 13.8853 for 2 clusters and Dunn’s index is 0.1300 for 6 clusters. The most optimal number of clusters in this study is 2 clusters.

Item Type: Book
Uncontrolled Keywords: Euclidean distance, Manhattan distance, Hierarchical cluster, K-Means cluster.
Divisions: Fakultas Matematika dan Ilmu Pengetahuan Alam > Statistika
Depositing User: Pitoyo Widhi Atmoko
Date Deposited: 23 Jan 2024 04:51
Last Modified: 23 Jan 2024 04:51
URI: http://repository.ub.ac.id/id/eprint/211940
[thumbnail of DALAM MASA EMBAGO] Text (DALAM MASA EMBAGO)
211940 Dwi Amri R.pdf
Restricted to Registered users only until 31 December 2025.

Download (1MB)

Actions (login required)

View Item View Item