Implementasi Algoritma Density-Based Spatial Clustering of Apllications with Noise (DBSCAN) Pada Mesin Pencari Dokumen Hasil Penelitian.

Liman, NaldoSancho (2014) Implementasi Algoritma Density-Based Spatial Clustering of Apllications with Noise (DBSCAN) Pada Mesin Pencari Dokumen Hasil Penelitian. Sarjana thesis, Universitas Brawijaya.

Abstract

Jumlah dokumen hasil penelitian yang terus bertambah banyak jumlahnya menuntut kebutuhan mekanisme pencarian dokumen yang handal. Karena itu muncullah aplikasi mesin pencari dokumen yang diharapkan dapat menghasilkan pencarian dokumen yang optimal. Hanya saja, mayoritas mesin pencari dokumen yang ada saat ini hanya mampu menemukan dokumen – dokumen yang mengandung kata kunci yang digunakan secara explisit saja. Hal ini menyebabkan pencarian dokumen – dokumen yang relevan terhadap kata kunci yang digunakan masih sulit untuk dilakukan. Beberapa faktor yang mempengaruhi kualitas dari sebuah mesin pencari dokumen adalah kemampuan untuk menemukan dokumen yang relevan dengan memanfaatkan kemiripan antara fitur dokumen dan kata kunci yang digunakan, pengurutan dokumen mulai dari yang paling relevan, dan menghilangkan dokumen – dokumen yang tidak relevan terhadap kata kunci yang digunakan. Penelitian ini memanfaatkan permodelan Vector Space Model untuk melakukan permodelan Sistem Temu Kembali Informasi karena Vector Space Model dapat melakukan pengembalian dokumen dengan menggunakan nilai cosine similarity sebagai basis perhitungan jarak kemiripan Antara fitur dokumen dan kata kunci yang digunakan. Selain itu, Vector Space Model juga dapat melakukan pengurutan dokumen yang ditemukan berdasarkan nilai cosine similarity-nya. Selain itu, untuk meningkatkan kualitas hasil pencarian, dilakukan Post-Retrieval Clustering dengan menggunakan algoritma DBSCAN yang mampu melakukan pengelompokan berdasarkan tingkat kepadatan di dalam ruang data. Selain itu, algoritma DBSCAN juga dapat memisahkan dokumen – dokumen yang dianggap noise / dokumen yang tidak memiliki hubungan dengan dokumen lainnya agar tidak merusak kualitas dari kluster – kluster yang dibentuk oleh algoritma ini. Pada penelitian ini, disimpulkan bahwa algoritma DBSCAN dapat mengoptimalkan hasil pencarian dengan peningkatan nilai F-Measure dari hasil pencarian sebesar 39,38% threshold 0.1 hingga 0.5 dan mengalami penurunan pada threshold 0.7 dan 0.9.

English Abstract

The increasing number of research publication demands a reliable searching methods. That is why an application called document search engine is made. It is expected to be able to deliver an optimal search results. But, most of document search engine only capable of finding documents that explicitly containing the searched keywords. This made the process of finding relevant publication become difficult. Several factors that influence the quality of document search engine are capability to find relevant document using similarity between document feature dan the keyword used, capability to rank the search results by its relevancy, and the capability to get rid of document that doesn’t relevant to the keyword used. This study is using Vector Space Model for the Information Retrieval Modelling because its capability to retrieve documents using cosine similarity to calculate the distance between the document and used keyword. Vector Space Model also capable to rank the retrieved documents using their cosine similarity. To improve the quality of the search results, Post-Retrieval Clustering with DBSCAN algorithm is done. DBSCAN algorithm is selected because it can cluster the documents using the density level in a data space. DBSCAN also capable to separate the noise / document that doesn’t fit to any cluster to increase the clustering quality. In this study concluded that DBSCAN capable of optimizing the quality of the search results by increasing the F-Measure value about 39,38% for threshold 0.1 to 0.5 and decreasing for threshold 0.7 and 0.9.

Item Type: Thesis (Sarjana)
Identification Number: SKR/FTIK/2014/147/051404255
Subjects: 000 Computer science, information and general works > 005 Computer programming, programs, data
Divisions: Fakultas Ilmu Komputer > Teknik Informatika
Depositing User: Budi Wahyono Wahyono
Date Deposited: 04 Aug 2014 14:02
Last Modified: 20 Oct 2021 03:57
URI: http://repository.ub.ac.id/id/eprint/145931
[thumbnail of Skripsi_Final_Fix_-_Naldo_Sancho_Liman.pdf]
Preview
Text
Skripsi_Final_Fix_-_Naldo_Sancho_Liman.pdf

Download (10MB) | Preview

Actions (login required)

View Item View Item