Temu Kembali Informasi Berita Olahraga Berbahasa Indonesia dengan Seleksi Fitur Term Frequency dan Metode BM25

Baihaqi, Rachmad Ridlo and Indriati, S.T., M.Kom. and Sutrisno, Ir., M.T. (2020) Temu Kembali Informasi Berita Olahraga Berbahasa Indonesia dengan Seleksi Fitur Term Frequency dan Metode BM25. Sarjana thesis, Universitas Brawijaya.

Abstract

Bertepatan dengan kemajuan globalisasi era modern sekarang, mengakibatkan meningkatnya pada pemakaian World Wide Web (WWW) dan internet untuk sumber yang menyediakan informasi secara online dari berbagai negara. Sebuah mesin pencari (search engine) dibutuhkan para pengguna internet untuk pencarian informasi. Oleh karena itu, mengakibatkan banyaknya dokumen yang disimpan dalam digital melonjak. Luasnya raihan para pembaca dan waktu yang singkat mengakibatkan munculnya media online dalam menyiarkan berita. Sistem temu kembali informasi (information retrieval) ialah berfungsi memperoleh informasi diinginkan pengguna atau relevan melalui query yang sudah diisi oleh pengguna. Diharapkan implementasi Information retrieval dapat digunakan dalam mendapatkan dokumen sesuai dengan yang dibutuhkan pengguna. Metode BM25 adalah menghitung nilai kemiripan (similarity) kemudian dilakukan proses pemeringkatan dari hasil kemiripan terhadap query. Ditambahkan dengan seleksi fitur term frequency pada saat melakukan training data. Pengujian dilakukan berdasarkan nilai precision @k dan nilai kappa measure terhadap 10 query. Didapatkan nilai terbaik pada pengujian precision @k adalah saat k=5, dengan nilai 90% dan 86%. Untuk nilai yang didapatkan dari pengujian kappa mesure sebesar 0,85.

English Abstract

Coinciding with the progress of globalization in the modern era now, resulting in increased use of the World Wide Web (WWW) and the internet for sources that provide information online from various countries. A search engine is needed by internet users to search for information. Therefore, resulting in the number of documents stored in digital soared. The vast reach of readers and the short time resulted in the emergence of online media in broadcasting news. The information retrieval system is the function of obtaining information desired by the user or relevant through a query that has been filled out by the user. It is expected that the implementation of Information retrieval can be used in obtaining documents in accordance with user requirements. BM25 method is to calculate the value of similarity (similarity) and then do the ranking process of the similarity of the results of the query. Added to the term frequency feature selection when training data. The test is based on the precision @k value and the kappa measure value of 10 queries. The best value obtained on the precision @k test is when k = 5, with values of 90% and 86%. For the value obtained from the kappa mesure test of 0.85.

Item Type: Thesis (Sarjana)
Identification Number: 0520150183
Uncontrolled Keywords: sistem temu kembali, text mining, BM25, seleksi term frequency, mesin pencari, information retrieval, text mining, BM25, frequency term selection, search engine
Subjects: 000 Computer science, information and general works > 004 Computer science
Divisions: Fakultas Ilmu Komputer > Teknik Informatika
Depositing User: Budi Wahyono Wahyono
Date Deposited: 23 Sep 2022 07:08
Last Modified: 11 Oct 2024 03:12
URI: http://repository.ub.ac.id/id/eprint/194722
[thumbnail of 0520150183 -Rachmad Ridlo Baihaqi.pdf] Text
0520150183 -Rachmad Ridlo Baihaqi.pdf

Download (3MB)

Actions (login required)

View Item View Item