Query Expansion Pada Sistem Temu Kembali Informasi Berbahasa Indonesia Dengan Metode Pembobotan Tf-Idf Dan Algoritme Cosine Similarity Berbasis Wordnet

Laxmi, Mahdarani Dwi (2018) Query Expansion Pada Sistem Temu Kembali Informasi Berbahasa Indonesia Dengan Metode Pembobotan Tf-Idf Dan Algoritme Cosine Similarity Berbasis Wordnet. Sarjana thesis, Universitas Brawijaya.

Abstract

Query Expansion secara umum merupakan suatu teknik untuk menambahkan query pada information retrieval dalam teknik relevance feedback. Query awal akan ditambahkan dengan beberapa term atau kata pada query untuk memberikan kemudahan dalam proses information retrieval. Temu Kembali Informasi dimulai dengan penyediaan beberapa koleksi dokumen yang akan digunakan. Dengan menggunakan operasi teks akan diproses menjadi suatu berkas inverted index. Untuk menemukannya, penelitian ini menggunakan metode pembobotan TF-IDF dan algoritme cosine similarity berbasis wordNet. Dengan menggunakan wordNet dilakukan penambahan query untuk memperbaiki sebuah teks tertentu sehingga sesuai dengan konsep kalimat tertentu. Pada penelitian ini akan digunakan synset berupa relasi kata hiponim untuk ditambahkan kedalam query. Berdasarkan hasil pengujian menggunakan precision@20 dari 10 query didapatkan nilai presisi rata-rata sebesar 0,7. Artinya probabilitas sistem dapat menemukan kembali dokumen yang relevan tanpa menggunakan query expansion adalah sebesar 70%. Berdasarkan hasil pengujian menggunakan precision@20 dari 10 query didapatkan nilai presisi rata-rata sebesar 0,52. Artinya probabilitas sistem dapat menemukan kembali dokumen yang relevan tanpa menggunakan query expansion adalah sebesar 52%.

English Abstract

Query Expansion is generally a technique for adding queries in information retrieval in relevance feedback techniques. The initial query will be added with several terms or words in the query to facilitate the process of information retrieval. Information Retrieval begins with the provision of several collections of documents to be used. Using text operations will be processed into an inverted index file. To find it, this research uses TF-IDF weighting method and wordNet based cosine similarity algorithm. By using wordNet, a query is added to correct a particular text so that it matches the concept of a particular sentence. In this research will be used synset in the form of a hyponym word relation to be added to the query. Based on the results of testing using precision @ 20 from 10 queries, the average precision value was 0.7. This means that the probability of the system can rediscover the relevant documents without using the query expansion is 70%. Based on the results of testing using precision @ 20 from 10 queries obtained an average precision value of 0.52. This means that the probability of the system can rediscover the relevant documents without using the query expansion is 52%.

Item Type: Thesis (Sarjana)
Identification Number: SKR/FTIK/2018/759/051809020
Uncontrolled Keywords: query expansion, information retrieval system, TF-IDF, cosine algorithm, wordnet.
Subjects: 000 Computer science, information and general works > 025 Operations of libraries, archives, information centers > 025.5 Services for users > 025.52 Reference and information services > 025.524 Information search and retrieval
Divisions: Fakultas Ilmu Komputer > Teknik Informatika
Depositing User: Budi Wahyono Wahyono
Date Deposited: 09 Apr 2019 02:33
Last Modified: 22 Oct 2021 03:55
URI: http://repository.ub.ac.id/id/eprint/161492
[thumbnail of Mahdarani Dwi Laxmi.pdf]
Preview
Text
Mahdarani Dwi Laxmi.pdf

Download (8MB) | Preview

Actions (login required)

View Item View Item