Peringkasan Teks Otomatis Pada Dokumen Berita Berbahasa Indonesia Dengan Metode Maximum Marginal Relevance Dengan Improved Sqrt-Cosine Similarity

Wicaksono, Kevin Aryo (2021) Peringkasan Teks Otomatis Pada Dokumen Berita Berbahasa Indonesia Dengan Metode Maximum Marginal Relevance Dengan Improved Sqrt-Cosine Similarity. Sarjana thesis, Universitas Brawijaya.

Abstract

Peringkasan teks otomatis pada dasarnya merupakan proses menyederhanakan suatu teks dengan cara membuat ringkasan yang mewakilkan isi dari teks tersebut. Sumber informasi utama tentang kejadian yang sudah terjadi atau sedang terjadi adalah berita, berita seringkali diharapkan dengan isi yang terlalu panjang sehingga tidak efektif bagi pembacanya. Hal tersebut menyebabkan kurang efisiennya waktu yang diperlukan untuk mendapatkan informasi dari suatu teks berita, sehingga diperlukan adanya ringkasan yang mewakili isi dari teks berita tersebut dalam bentuk yang lebih sederhana sehingga lebih mudah dan cepat dipahami. Penelitian ini diawali dengan melakukan preprocessing pada teks berita yang akan diringkas. Proses selanjutnya adalah mencari bobot masing-masing token dengan metode pembobotan TFIDF, dengan memanfaatkan nilai TFIDF maka dapat dicari similarity antar kalimat dengan metode ISC Similarity. Ringkasan dibuat berdasarkan nilai MMR dari masing-masing kalimat mulai dari yang tertinggi, nilai MMR yang tinggi menandakan bahwa kalimat tersebut mirip dengan query yang digunakan. Query dalam pembuatan ringkasan didapatkan dari judul berita yang diuji. Hasil pengujian ringkasan oleh sistem dengan metode ROUGE-L mendapatkan nilai rata-rata tertinggi pada ringkasan dengan persentase 10% dengan nilai rata-rata precision 0,8743, recall 0,7678, dan f-measure 0,7678.

English Abstract

-Automatic text summarization in general can be defined as a process to simplify a text by making a summary that represent the contents of the text. In real life, the main source for knowing an event that is happening or already happened is news, but frequently news’ text presented in a long story. A long news’ text often led to an efficiency issue in time used for understanding the content of the news, as for the solution a text summary is needed to save more time used in understanding the content of a news. This research began with implementing preprocessing to the news’ text that is going to summarized. The next process is implementing TFIDF weighting method to get the weight of each token, with ISC Similarity method the TFIDF value was then used to get the similarity value between every sentence in the text. The creation of the text summary is based on MMR value, higher the value mean that the sentence is most likely represent the content of the text. The title of the text is used as the query for text summarization process. The highest average test results of this research using the ROUGE-L method is found at 10% summary with the value of precision 0,8743, recall 0,7678, and f-measure 0,7678.

Other obstract

-

Item Type: Thesis (Sarjana)
Identification Number: 052115
Subjects: 000 Computer science, information and general works > 004 Computer science
Divisions: Fakultas Ilmu Komputer > Teknik Informatika
Depositing User: Unnamed user with username rizky
Date Deposited: 22 Oct 2021 06:49
Last Modified: 10 Oct 2024 02:13
URI: http://repository.ub.ac.id/id/eprint/184452
[thumbnail of Kevin Aryo Wicaksono_unlocked (1).pdf] Text
Kevin Aryo Wicaksono_unlocked (1).pdf

Download (3MB)

Actions (login required)

View Item View Item