Analisis Two Step Cluster (TSC) dan Analisis Latent Class Cluster (LCC) pada Pengelompokan Data Berskala Campuran Kategorik dan Kontinu

Umah, Fachriyatul (2014) Analisis Two Step Cluster (TSC) dan Analisis Latent Class Cluster (LCC) pada Pengelompokan Data Berskala Campuran Kategorik dan Kontinu. Sarjana thesis, Universitas Brawijaya.

Abstract

Analisis cluster (kelompok) merupakan analisis yang digunakan untuk mengelompokkan objek-objek berdasarkan ukuran kemiripan. Data yang digunakan pada analisis cluster dapat terdiri dari data kategorik saja, data kontinu saja, maupun campuran antara data kategorik dan kontinu. Terkait dengan permasalahan pengelompokan pada data berskala campuran, terdapat beberapa metode yang dapat digunakan, diantaranya adalah metode Two Step Cluster (TSC) dan Latent Class Cluster (LCC). Penelitian ini bertujuan untuk mengetahui perbedaan hasil pengelompokan pada data berskala campuran dengan menggunakan analisis TSC dan LCC, serta mengetahui metode manakah yang lebih baik dalam pengelompokannya. Kriteria perbandingan yang digunakan yaitu rasio keragaman antara SSW (Sum of Square Within Cluster) dengan SSB (Sum of Square Between Cluster). Hasil pengelompokan yang baik adalah jika objek dalam kelompok yang sama memiliki keragaman yang kecil sedangkan objek antar kelompok memiliki keragaman yang besar. Data yang digunakan pada penelitian ini adalah 20 data sekunder yang memiliki variabel berskala campuran kategorik dan kontinu. Hasil penelitian menunjukkan dari 20 data yang digunakan, terdapat 4 data yang menghasilkan banyaknya kelompok yang sama dan 16 data lainnya menghasilkan banyaknya kelompok yang berbeda antara analisis TSC dan LCC. Nilai rata-rata dari 20 rata-rata rasio keragaman (SSW/SSB) untuk analisis TSC sebesar 1,3006 dan untuk analisis LCC sebesar 0,6227, sehingga dapat disimpulkan bahwa analisis Latent Class Cluster menghasilkan pengelompokan yang lebih baik dari analisis Two Step Cluster.

English Abstract

Clusters analysis is an analysis that is used to classify objects based on similarity measure. The data used in the cluster analysis can consist of categories data only, continuous data only, or a mix between categories and continuous data. Related to the issue clustering of mixed scale data, there are several methods that can be used, including the method of Two Step Cluster analysis (TSC) and Latent Class Cluster analysis (LCC). This research aims to know the differences results in clustering mixed scale data by using analysis of TSC and LCC, and find out which method is better in its clustering. Criteria of comparison that used in this research is ratio of the diversity between SSW (Sum of Square Within a Cluster) and SSB (Sum of Square Between Clusters). A good clustering results is if the object in the same group have small diversity whereas objects between groups has a great diversity. The data used in this research is 20 secondary data that has a variable mixture of categories and continuous scale. The results showed that from 20 data used in this research, there were only 4 data that produces same number of cluster and 16 other data yield different number of cluster in analysis of TSC and LCC. Average value of 20 average ratio of diversity (SSW/SSB) for TSC is 1,3006 and for LCC is 0,6227, so the conclusion is Latent Class Cluster (LCC) analysis produces a better clustering than Two Step Cluster (TSC) in clustering mixed scale data categories and continuous.

Item Type: Thesis (Sarjana)
Identification Number: SKR/MIPA/2014/59/051400904
Subjects: 500 Natural sciences and mathematics > 510 Mathematics
Divisions: Fakultas Matematika dan Ilmu Pengetahuan Alam > Matematika
Depositing User: Budi Wahyono Wahyono
Date Deposited: 11 Feb 2014 09:20
Last Modified: 13 Jan 2023 01:46
URI: http://repository.ub.ac.id/id/eprint/154073
[thumbnail of FACHRIYATUL UMAH.pdf] Text
FACHRIYATUL UMAH.pdf

Download (5MB)

Actions (login required)

View Item View Item