BernadetteShantiC (2009) Agglomerative Hierarchical Clustering untuk Penggabungan Dokumen Teks Berbahasa Indonesia dengan Metode Complete Linkage. Sarjana thesis, Universitas Brawijaya.
Abstract
Sistem penggabungan dokumen merupakan sistem yang memberi kemudahan kepada pengguna untuk mendapatkan informasi dari beberapa dokumen sekaligus. Dengan sistem ini, pengguna tidak perlu lagi membaca masing-masing dokumen satu persatu untuk mendapatkan informasi yang dibutuhkan. Dengan demikian, informasi yang didapat akan lebih mudah dicerna dan dimengerti. Permasalahan yang timbul pada saat menggabungkan dokumen adalah bagaimana menggabungkan kalimat-kalimat dari dokumen yang berbeda supaya tetap memiliki keterkaitan satu sama lain. Penggabungan kalimat dilakukan dengan cara mengelompokkan kalimat-kalimat menjadi suatu cluster dengan algoritma hierarchical clustering melalui pendekatan agglomerative , dimana anggota cluster awal adalah masing-masing kalimat yang ada, dan kemudian bergabung menjadi cluster yang lebih besar dengan kalimat yang lain. Aturan penggabungan kalimat ditentukan berdasarkan bobot yang dimiliki masing-masing kalimat. Untuk mengevaluasi sistem penggabungan dokumen ini dilakukan pembandingan dengan dokumen ideal. Ukuran yang digunakan adalah rasio dari jumlah kalimat yang bersesuaian dengan kalimat ideal yang dibandingkan dengan jumlah total kalimat yang ada. Efektifitas sistem meningkat sejalan dengan bertambahnya jumlah dokumen yang digabungkan.
English Abstract
Document merging system is a system which simplifies user in getting information from several documents at once. By this system, user does not have to read each document one by one to get information they need anymore. Therefore, the information will be easier to absorb and understand. The problem which occurred when we merge documents is how to merge with paying attention to the connections among sentences. A sentence clustering is done by hierarchical clustering algorithm with agglomerative approach where initial cluster members are each sentence itself, and then they integrate with other sentence become larger cluster. The rule of integrating is defined by sentence weight. A comparison with an ideal document is used to evaluate this merging document system. The measure that used is the ratio of total equivalent sentences and total numbers of the sentences. The effectiveness of system increases along with the increasing of the number of source document that merged.
Item Type: | Thesis (Sarjana) |
---|---|
Identification Number: | SKR/MIPA/2009/269/050902736 |
Subjects: | 500 Natural sciences and mathematics > 510 Mathematics |
Divisions: | Fakultas Matematika dan Ilmu Pengetahuan Alam > Matematika |
Depositing User: | Unnamed user with email repository.ub@ub.ac.id |
Date Deposited: | 05 Oct 2009 10:37 |
Last Modified: | 22 Oct 2021 07:05 |
URI: | http://repository.ub.ac.id/id/eprint/152229 |
Preview |
Text
050902736.pdf Download (3MB) | Preview |
Actions (login required)
View Item |