Peringkasan Artikel Berbahasa Indonesia Menggunakan Textrank Dengan Pembobotan BM25

Fadhila Henawan, Yurdha (2020) Peringkasan Artikel Berbahasa Indonesia Menggunakan Textrank Dengan Pembobotan BM25. Sarjana thesis, Universitas Brawijaya.

Abstract

Penggunaan internet sebagai sumber informasi telah membawa manusia pada era one click away. Apa pun bisa diakses di mana pun kapan pun, baik secara visual maupun tidak. Namun, tidak semua informasi yang diakses selalu sesuai dengan konteks yang diinginkan. Untuk memudahkan pengguna internet dalam mendapatkan informasi yang ringkas dengan tidak merusak atau menghilangkan informasi penting, maka dibutuhkan suatu peringkasan otomatis. Salah satu cara untuk mendapatkan ringkasan pada sebuah dokumen adalah dengan mencari kumpulan kalimat penting pada dokumen yang dapat merepresentasikan dokumen asli secara keseluruhan. Metode peringkasan tersebut disebut juga dengan peringkasan ekstraktif. Pada penelitian ini, peringkasan ekstraktif dilakukan dengan memeringkatkan setiap kalimat pada sebuah dokumen dan mengambil kalimat dengan peringkat teratas sebagai ringkasan. Metode TextRank yang digunakan pada penelitian ini merepresentasikan dokumen sebagai graf, setiap kalimat dianggap sebagai node dan hubungan antara kalimat (node) merupakan nilai similarity antar kalimat. Fungsi similarity yang digunakan adalah BM25 dengan metode pemeringkatan PageRank. Panjang ringkasan yang dihasilkan sistem disesuaikan dengan besar nilai compression rate yang digunakan. Setelah membandingkan hasil ringkasan yang didapatkan sistem peringkasan otomatis dengan hasil ringkasan yang didapatkan dari expert (pakar) sebanyak 10 dokumen, penelitian ini berhasil dilakukan dengan kualitas ringkasan terbaik didapatkan pada saat penggunaan compression rate sebesar 30% dengan nilai rata-rata precision, recall, dan f-measure secara berturut-turut adalah 0,551692; 0,551692; dan 0,551692.

English Abstract

The use of the internet as a source of information has brought humans to a one- click era. Anything can be accessed anywhere, visually or not. However, every information accessed is not always match with the context itself. An automatic summarization is needed to help people to get the concise informations without ruin the context and missing the point. One way to get a summarize of the document is to find a collection of important sentences in the document that can represent the original document as a whole. That automatic text summarization method is also called extractive summarize. In this study, extractive summarization is done by checking each sentence in a document and ranking the important sentences. The TextRank method used in this study will represent the document as a graph, each sentence will be considered as a node and the relationship between sentences (nodes) is the value of similarity between sentences. The similarity function used is BM25 with the PageRank as ranking method. The resulting length of the system will be adjusted to the value of the level of compression used. After comparing the summarization result between the automatic system and an expert of 10 documents, this research is successfully carried out with the best quality is obtained when using a compression rate of 30% with an average value of precision, recall, and f-measure is 0.551692; 0.551692; and 0.551692.

Item Type: Thesis (Sarjana)
Identification Number: 0520150485
Uncontrolled Keywords: extRank, BM25, PageRank, compression rate
Subjects: 600 Technology (Applied sciences) > 621 Applied physics > 621.3 Electrical, magnetic, optical, communications, computer engineering; electronics, lighting
Divisions: Fakultas Ilmu Komputer > Teknik Informatika
Depositing User: Unnamed user with username nova
Date Deposited: 21 Sep 2022 06:46
Last Modified: 21 Sep 2022 06:46
URI: http://repository.ub.ac.id/id/eprint/194533
[thumbnail of DALAM MASA EMBARGO] Text (DALAM MASA EMBARGO)
Yurdha Fadhila Hernawan.pdf
Restricted to Registered users only until 31 December 2023.

Download (4MB)

Actions (login required)

View Item View Item