Improved Cat Swarm Optimization Algorithm Untuk Penentuan Pusat Cluster Pada K-Means Clustering

Haryani, Dewi (2017) Improved Cat Swarm Optimization Algorithm Untuk Penentuan Pusat Cluster Pada K-Means Clustering. Magister thesis, Universitas Brawijaya.

Abstract

Clustering merupakan salah satu teknik yang digunakan dalam konsep data mining yang bertujuan untuk mempartisi objek menggunakan similarity measure. Metode yang sangat populer digunakan dalam clustering adalah KMeans clustering karena implementasinya yang sangat sederhana dan dapat menangani data dalam jumlah besar serta proses yang relatif singkat. Meskipun demikian, K-Means juga memiliki kelemahan, pada penentuan titik awal pusat cluster, ditentukan secara random sehingga apabila tidak tepat dalam pemilihan titik awal pusat cluster, hasil pengelompokan data juga menjadi kurang akurat. Kelemahan lainnya, dalam proses pembaharuan titik pusatnya sangat memungkinkan hasil cluster konvergen pada local optima. Cat Swarm Optimization (CSO) sebagai salah satu algoritma heuristic terbaru yang termasuk dalam swarm intelligence. Dalam penelitian sebelumnya algoritma ini terbukti memiliki performansi yang lebih baik dalam permasalahan optimasi jika dibandingkan dengan algoritma optimasi heuristic lainnya seperti Particle Swarm Optimization (PSO). Akan tetapi algoritma CSO juga memiliki kelemahan yaitu sering premature convergent. Kemampuan konvergensi metode CSO lebih baik setelah ditambahkan inertia weight jika dibandingkan algoritma basic PSO dan basic CSO. Penambahan inertia weight dapat memperlebar ruang pencarian pada CSO sehingga mencegah premature convergent serta dapat meningkatkan diversity. Fokus dalam penelitian ini adalah optimasi pencarian pusat cluster pada KMeans clustering dengan menggunakan classification datasets dari UCI Machine Learning Repository diantaranya iris, breast cancer dan wine. Metode yang diusulkan adalah Improved Cat Swarm Optimization Algorithm untuk penentuan pusat cluster pada K-Means clustering. Hasil optimasi penentuan pusat cluster pada K-Means clustering akan dibandingkan dengan metode PSO dan CSO. Hasil pengujian menunjukkan hasil clustering pada metode ICSO memiliki persentase nilai error klasifikasi yang rendah, yaitu 48%, 3% dan 22% untuk data iris, breast cancer dan wine jika dibandingkan dengan metode PSO dan CSO. Hal ini menunjukkan bahwa metode ICSO mampu mengoptimalkan penentuan pusat cluster pada K-Means clustering dengan hasil yang lebih akurat dibandingkan dengan metode yang lain.

English Abstract

Clustering is a method used in data mining procedures in order to partite objects using similarity measuring. As a very popular method in clustering, Kmeansclustering is used primarily for its simplicity and capability to handle a vast amount of data in relatively short period process. K-means, however, has a drawback as it uses random definition for cluster centerpoint start position which makes a large inaccuracy in data grouping. Another disadvantage is its cluster result tends to converge in local optima. Cat Swarm Optimization (CSO) is a new heuristic algorithm, which can be classified as swarm intelligence. In previous research, this algorithm has been proven to possess better performance in optimization problem compared to other algorithm, e.g. Particle Swarm Optimization (PSO). The CSO, however, tends to have premature convergence as its disadvantage. The convergence performance of CSO looks better after inertia weight has been added, as compared to basic PSO and basic CSO. The inertia weight featuring in CSO can widen the search space, hence avoiding premature convergence and improving its diversity. This research is focusing in searching optimization of cluster centerpoint on K-means clustering with classification datasets from UCI Machine Learning Repository, e.g. iris, breast cancer, and wine. The proposed method in this research is improved cat swarm optimization algorithm to determination of cluster centerpoint in K-means clustering. The optimization result of cluster center determination on K-Means clustering will be compared with the PSO and CSO method. The test results showed that clustering results on the ICSO method had a low percentage of classification error values, ie 48%, 3% and 22% for iris, breast cancer and wine data respectively when compared with PSO and CSO methods. This shows that the ICSO method is able to optimize the determination of cluster center on KMeans clustering with more accurate results than other methods.

Item Type: Thesis (Magister)
Identification Number: TES/006.3/HAR/i/2017/041708506
Uncontrolled Keywords: SWARM INTELLIGENCE, HEURISTIC ALGORITHEMS, CLUSTER ANALYSIS
Subjects: 000 Computer science, information and general works > 006 Special computer methods > 006.3 Artificial intelligence
Divisions: S2/S3 > Magister Teknik Elektro, Fakultas Teknik
Depositing User: Nur Cholis
Date Deposited: 18 Sep 2017 06:34
Last Modified: 16 Sep 2022 05:06
URI: http://repository.ub.ac.id/id/eprint/2637
[thumbnail of BAGIAN DEPAN.pdf]
Preview
Text
BAGIAN DEPAN.pdf

Download (3MB) | Preview
[thumbnail of 2. BAB I.pdf]
Preview
Text
2. BAB I.pdf

Download (92kB) | Preview
[thumbnail of 3. BAB II.pdf]
Preview
Text
3. BAB II.pdf

Download (497kB) | Preview
[thumbnail of 4. BAB III.pdf]
Preview
Text
4. BAB III.pdf

Download (85kB) | Preview
[thumbnail of 5. BAB IV.pdf]
Preview
Text
5. BAB IV.pdf

Download (734kB) | Preview
[thumbnail of 6. BAB V.pdf]
Preview
Text
6. BAB V.pdf

Download (104kB) | Preview
[thumbnail of 7. BAB VI.pdf]
Preview
Text
7. BAB VI.pdf

Download (76kB) | Preview
[thumbnail of DAFTAR PUSTAKA.pdf]
Preview
Text
DAFTAR PUSTAKA.pdf

Download (84kB) | Preview

Actions (login required)

View Item View Item