Agglomerative Hierarchical Clustering untuk Penggabungan Dokumen Teks Berbahasa Indonesia dengan Metode Complete Linkage

BernadetteShantiC (2009) Agglomerative Hierarchical Clustering untuk Penggabungan Dokumen Teks Berbahasa Indonesia dengan Metode Complete Linkage. Sarjana thesis, Universitas Brawijaya.

Abstract

Sistem penggabungan dokumen merupakan sistem yang memberi kemudahan kepada pengguna untuk mendapatkan informasi dari beberapa dokumen sekaligus. Dengan sistem ini, pengguna tidak perlu lagi membaca masing-masing dokumen satu persatu untuk mendapatkan informasi yang dibutuhkan. Dengan demikian, informasi yang didapat akan lebih mudah dicerna dan dimengerti. Permasalahan yang timbul pada saat menggabungkan dokumen adalah bagaimana menggabungkan kalimat-kalimat dari dokumen yang berbeda supaya tetap memiliki keterkaitan satu sama lain. Penggabungan kalimat dilakukan dengan cara mengelompokkan kalimat-kalimat menjadi suatu cluster dengan algoritma hierarchical clustering melalui pendekatan agglomerative , dimana anggota cluster awal adalah masing-masing kalimat yang ada, dan kemudian bergabung menjadi cluster yang lebih besar dengan kalimat yang lain. Aturan penggabungan kalimat ditentukan berdasarkan bobot yang dimiliki masing-masing kalimat. Untuk mengevaluasi sistem penggabungan dokumen ini dilakukan pembandingan dengan dokumen ideal. Ukuran yang digunakan adalah rasio dari jumlah kalimat yang bersesuaian dengan kalimat ideal yang dibandingkan dengan jumlah total kalimat yang ada. Efektifitas sistem meningkat sejalan dengan bertambahnya jumlah dokumen yang digabungkan.

English Abstract

Document merging system is a system which simplifies user in getting information from several documents at once. By this system, user does not have to read each document one by one to get information they need anymore. Therefore, the information will be easier to absorb and understand. The problem which occurred when we merge documents is how to merge with paying attention to the connections among sentences. A sentence clustering is done by hierarchical clustering algorithm with agglomerative approach where initial cluster members are each sentence itself, and then they integrate with other sentence become larger cluster. The rule of integrating is defined by sentence weight. A comparison with an ideal document is used to evaluate this merging document system. The measure that used is the ratio of total equivalent sentences and total numbers of the sentences. The effectiveness of system increases along with the increasing of the number of source document that merged.

Item Type: Thesis (Sarjana)
Identification Number: SKR/MIPA/2009/269/050902736
Subjects: 500 Natural sciences and mathematics > 510 Mathematics
Divisions: Fakultas Matematika dan Ilmu Pengetahuan Alam > Matematika
Depositing User: Unnamed user with email repository.ub@ub.ac.id
Date Deposited: 05 Oct 2009 10:37
Last Modified: 22 Oct 2021 07:05
URI: http://repository.ub.ac.id/id/eprint/152229
[thumbnail of 050902736.pdf]
Preview
Text
050902736.pdf

Download (3MB) | Preview

Actions (login required)

View Item View Item