Pengelompokan Data Berdimensi Tinggi Menggunakan Algoritma Projected Clustering

Hastitarizki, Farieda (2008) Pengelompokan Data Berdimensi Tinggi Menggunakan Algoritma Projected Clustering. Sarjana thesis, Universitas Brawijaya.

Abstract

Kemajuan teknologi dalam bidang basis data pada masa sekarang ini meningkat dengan sangat cepat, dan kemudahan dalam mengumpulkan data membuat volume data semakin besar. Hal ini menyebabkan kebutuhan analisis data semakin tinggi pula. Salah satu teknologi yang dapat memproses analisis data adalah data mining . Salah satu teknik data mining yang sering digunakan untuk analisis data adalah clustering . Pada umumnya clustering didesain untuk menganalisis data dengan dimensi yang rendah. Yang dimaksud dengan dimensi adalah atribut suatu data. Data berdimensi tinggi dapat di cluster dengan metode transformasi fitur dan teknik seleksi fitur. Salah satu teknik seleksi fitur adalah subspace clustering. Algoritma yang menerapkan konsep subspace clustering adalah algoritma Projected Clustering ( PROCLUS ). Pada penelitian ini akan digunakan analisis data dengan data mining dengan menggunakan algoritma PROCLUS untuk proses pengelompokan data . Algoritma ini dikhususkan untuk analisis data numerik dan menggunakan konsep jarak dalam perhitungannya. Data yang diproses dalam penelitian ini adalah sebuah abalone (kerang) dataset . Dataset ini akan dikelompokkan berdasar jaraknya. Parameter input an yang digunakan dalam algoritma ini adalah jumlah cluster dan jumlah rata-rata dimensi. Untuk mengevaluasi sistem dibuat evaluasi untuk menguji keterkaitan antara running time (lama waktu proses oleh sistem) dengan parameter inputan yaitu ukuran dataset , jumlah dimensi dataset , jumlah cluster , ratarata dimensi tiap cluster dan dicari perbandingan running time iterasi antara metode hill climbing dan iterasi dengan menggunakan dataset dan medoid yang sama, dicari kesesuaian antara cluster hasil dengan ukuran dataset dan yang terakhir diuji keterkaitan antara similarity dilihat dari radius cluster dengan parameter jumlah cluster dan jumlah dimensi, dan keterkaitan jumlah cluster dengan dimensi yang dibentuk . Hasil uji coba dan evaluasi menunjukkan bahwa semakin tinggi parameter inputan, semakin tinggi running time yang digunakan sistem untuk memproses pengelompokan data. Dan semua data dapat ter cluster .

Item Type: Thesis (Sarjana)
Identification Number: SKR/MIPA/2008/217/050802426
Subjects: 500 Natural sciences and mathematics > 510 Mathematics
Divisions: Fakultas Matematika dan Ilmu Pengetahuan Alam > Matematika
Depositing User: Unnamed user with email repository.ub@ub.ac.id
Date Deposited: 04 Sep 2008 09:42
Last Modified: 11 Mar 2022 03:49
URI: http://repository.ub.ac.id/id/eprint/151878
[thumbnail of 050802426.pdf]
Preview
Text
050802426.pdf

Download (3MB) | Preview

Actions (login required)

View Item View Item