Peringkasan Teks Otomatis Pada Artikel Berita Hiburan Berbahasa Indonesia Menggunakan Metode Bm25

Andriani, Desy (2019) Peringkasan Teks Otomatis Pada Artikel Berita Hiburan Berbahasa Indonesia Menggunakan Metode Bm25. Sarjana thesis, Universitas Brawijaya.

Abstract

Salah satu kegiatan yang paling sering dilakukan pengguna internet Indonesia adalah membaca berita. Lebih dari 50% pengguna internet Indonesia memanfaatkan internet untuk membaca berita. Namun, masalah akan muncul apabila isi dari artikel adalah teks yang panjang sehingga pembacanya membutuhkan waktu untuk membaca dan memahami isi dari artikel tersebut. Salah satu cara agar pengguna tetap dapat membaca dan memahami isi artikel dengan cepat adalah dengan membaca ringkasannya. Maka dari itu diperlukan sistem peringkas teks otomatis secara ekstratif pada artikel berita hiburan dengan tujuan menekankan informasi utama dan membantu pembaca memperoleh informasi utama dari teks dengan cepat tanpa perlu membaca seluruh isi teks atau dokumen. Penelitian ini menggunakan metode BM25 yang merupakan metode pembobotan kalimat yang mengurutkan kalimat berdasarkan term yang muncul pada setiap kalimat dalam dokumen. BM25 menggunakan pembobotan tf idf untuk pembobotan kata dan hubungan antara term dan tiap kalimat dalam dokumen dipengaruhi oleh parameter bebas k1 dan b. Berdasarkan hasil pengujian didapatkan bahwa peringkasan teks dengan metode BM25 memperoleh nilai rata-rata precision, recall, dan f-measure terbaik saat nilai compression rate yang digunakan adalah 30%. Dimana nilai rata-rata precision, recall, dan f-measure secara berurutan adalah sebesar 0,730, 0,738, dan 0,734.

English Abstract

One of the most often activitiy carried out by Indonesian internet users is reading news. More than 50% of Indonesian internet users use the internet to read news. However, problems will arise if the content of the article is a long text so that the reader needs time to read and understand the contents of the article. One way that users can still read and understand the contents of articles quickly is by reading the summary. Therefore we need an automatic text summarization system in entertainment news articles with the aim of emphasizing the main information and helping the reader get the main information from the text quickly and don’t need to read the entire contents of the text or document. This study uses the BM25 method which is a method of weighting sentences that sort sentences based on terms that appear in each sentence in the document. BM25 is using tf idf weighting for word weighting and the relationship between terms and each sentence in the document is influenced by free parameters k1 and b. Based on the test results it was found that summarizing the text with the BM25 method obtained the best average precision result, recall and f-measure values when the value of the compression rate used was 30%. Where the average values of precision, recall, and f-measure are 0,730, 0,738 and 0,734.

Other obstract

-

Item Type: Thesis (Sarjana)
Identification Number: SKR/FILKOM/2019/194/051902364
Uncontrolled Keywords: peringkasan teks otomatis, text mining, BM25, compression rate, automatic text summarization, text mining, BM25, compression rate
Subjects: 000 Computer science, information and general works > 005 Computer programming, programs, data > 005.5 General purpose application programs > 005.52 Word processing
Divisions: Fakultas Ilmu Komputer > Teknik Informatika
Depositing User: Nur Cholis
Date Deposited: 09 Jun 2020 14:36
Last Modified: 24 Oct 2021 05:05
URI: http://repository.ub.ac.id/id/eprint/168930
[thumbnail of Desy Andriani (2).pdf]
Preview
Text
Desy Andriani (2).pdf

Download (4MB) | Preview

Actions (login required)

View Item View Item