Sistem Temu Kembali Informasi Pada Dokumen Teks Berbahasa Indonesia Menggunakan Bisecting K-Means

RahmanS, Arif (2013) Sistem Temu Kembali Informasi Pada Dokumen Teks Berbahasa Indonesia Menggunakan Bisecting K-Means. Sarjana thesis, Universitas Brawijaya.

Abstract

Internet telah mengalami perkembangan yang sangat pesat. Beragam informasi tersedia di internet dan dapat diakses secara luas oleh penggunanya. Dengan banyaknya dokumen web yang beredar di internet saat ini menyebabkan terjadinya ledakan informasi yang membuat pengguna internet mengalami kesulitan dalam mencari informasi yang akurat dan tepat. Salah satu upaya untuk mengoptimalkan pencarian adalah dengan pengelompokan. Penerapan sistem temu kembali informasi berbasis klaster ini sebagian besar mengunakan metode hierarchical dalam pengelompokannya. Meskipun metode Hierarchical Clustering seringkali dianggap lebih baik, tetapi teknik ini tidak mampu untuk meng-realokasi entitas yang telah dikelompokkan pada tahapan proses. Kompleksitas waktu dari pendekatan Hierarchical Clustering ini juga bersifat kuadratik.Sehingga metode partitional lebih cocok untuk pencarian pada dataset yang besar. Penelitian ini bertujuan untuk mengimplementasi algoritma Bisecting KMeans pada sistem temu kembali informasi. Nilai akurasi dari sistem temu kembali informasi ini memiliki nilai recall rata-rata sebesar 0,675 , nilai rata-rata precision sebesar 0,43 dan nilai F-Measure rata-rata sebesar 0,486 dengan waktu komputasi rata-rata sebesar 6 menit 9 detik. Penelitian ini menunjukkan bahwa waktu komputasi dari sistem temu kembali informasi berbasis klaster dengan bisecting k-means lebih baik dibanding dengan metode Centroid Linkage Hierarchical Method.

English Abstract

Internet has been developed rapidly. Kinds of information are available in internet and could be accessed by many users. By many web documents are found in internet right now caused information explosion that makes internet users having trouble in finding accurate and proper information. The use of information retrieval system based on cluster is mostly using hierarchical method in its classification. Although hierarchical clustering method often looks better, but this technique is unable to relocate the entity which has classified on process stage of process. Time complexity of hierarchical clustering approach is quadratic. So partition method is more suitable for finding a big dataset. This research aims to imply bisecting k-means algorithm on information retrieval system. Accuracy value of this system has recall value about 0,67, average precision value about 0,43 and average F-Measure about 0,48 with computation time about 6 minutes 9 seconds. This research shows that computation time of the information retrieval system based cluster with bisecting k-means is better than Centroid Linkage Hierarchical Method.

Item Type:	Thesis (Sarjana)
Identification Number:	SKR/FTIK/2013/150/051307720
Subjects:	000 Computer science, information and general works > 005 Computer programming, programs, data
Divisions:	Fakultas Ilmu Komputer > Teknik Informatika
Depositing User:	Endang Susworini
Date Deposited:	18 Nov 2013 09:03
Last Modified:	23 Oct 2021 09:30
URI:	http://repository.ub.ac.id/id/eprint/145784

[thumbnail of SKRIPSI_-_M_FAJAR_DEWANTARA_-_0610960041.pdf]

Preview

Text
SKRIPSI_-_M_FAJAR_DEWANTARA_-_0610960041.pdf
Download (3MB) | Preview

Actions (login required)

View Item