Frinta, Khalisma (2019) Pencarian Berita Berbahasa Indonesia Menggunakan Metode BM25. Sarjana thesis, Universitas Brawijaya.
Abstract
Perkembangan teknologi yang semakin pesat berdampak pada meningkatnya penggunaan internet sebagai sumber penyedia informasi online dari seluruh dunia. Dalam pencarian informasi pengguna menggunakan bantuan sebuah mesin pencari (search engine). Perkembangan tersebut juga membuat penyimpanan dokumen secara digital meningkat. Berita merupakan sumber informasi mengenai suatu peristiwa atau pendapat yang memiliki nilai penting dan menarik untuk dipublikasikan secara luas melalu media massa. Tidak terbatasnya jangkauan pembaca serta efisiensi waktulah yang membuat berbagai media pemberitaan beralih menjadi media online. Information retrieval bertujuan untuk menghasilkan dokumen yang relevan terhadap kebutuhan pengguna dari suatu kumpulan informasi secara otomatis berdasarkan keyword pada query yang diberikan oleh pengguna. Penerapan information retrieval diharapkan mampu mempermudah pencarian informasi serta mendapatkan hasil yang akurat. BM25 merupakan sebuah sistem dalam proses pemeringkatan yang digunakan untuk mengurutkan hasil kecocokan (similarity) terhadap seluruh dokumen training berdasarkan query yang dicari. Metode BM25 dikategorikan sebagai metode terbaik dalam kelas best match. Pengujian dilakukan berdasarkan nilai precision @k dan nilai r-precision terhadap 12 query. Hasil pengujian nilai precision @k terbaik pada saat nilai k=5, yakni dengan nilai 0,83. Sedangkan hasil pengujian nilai r-precision terbaik dengan nilai 1.
English Abstract
Rapid technological developments have resulted in increased use of the internet as a source of online information providers from around the world. In searching for information users use the help of a search engine. These developments also make digital document storage increase. News is a source of information about an event or opinion that has important and interesting value to be widely publicized through the mass media. The unlimited reach of readers and the efficiency of time makes the various media reports turn to online media. Information retrieval aims to produce documents that are relevant to the needs of users of a collection of information automatically based on keywords in the queries given by users. The application of information retrieval is expected to facilitate information retrieval and obtain accurate results. BM25 is a system in the ranking process that is used to sort the results of a match (similarity) to all training documents based on the query. BM25 method is categorized as the best method in the best match class. Tests are based on precision @k values and r-precision values for 12 queries. The best test results for precision @ k values when k=5, which is 0.83. While the results of testing the best r-precision values with a value of 1.
Item Type: | Thesis (Sarjana) |
---|---|
Identification Number: | SKR/FILKOM/2019/30/051902200 |
Uncontrolled Keywords: | berita, mesin pencari, text mining, sistem temu kembali informasi, BM25-news, search engine, text mining, information retrieval, BM25 |
Subjects: | 000 Computer science, information and general works > 025 Operations of libraries, archives, information centers > 025.5 Services for users > 025.52 Reference and information services > 025.524 Information search and retrieval |
Divisions: | Fakultas Ilmu Komputer > Teknik Informatika |
Depositing User: | soegeng sugeng |
Date Deposited: | 09 Jun 2020 14:06 |
Last Modified: | 19 Oct 2021 09:24 |
URI: | http://repository.ub.ac.id/id/eprint/168862 |
Preview |
Text
Khalisma Frinta.pdf Download (2MB) | Preview |
Actions (login required)
View Item |