Peringkasan Literatur Ilmu Komputer Bahasa Indonesia Berbasis Fitur Statistik Dan Linguistik Menggunakan Metode Gaussian Naïve Bayes

Fhadli, Muhammad (2017) Peringkasan Literatur Ilmu Komputer Bahasa Indonesia Berbasis Fitur Statistik Dan Linguistik Menggunakan Metode Gaussian Naïve Bayes. Sarjana thesis, Universitas Brawijaya.

Abstract

Di tengah era dengan kebutuhan data yang besar ini, peringkasan teks merupakan suatu kebutuhan. Dengan peringkasan teks, setiap orang bisa mendapatkan informasi yang mendeskripsikan keseluruhan data teks yang besar hanya dengan beberapa kalimat. Permasalahan dalam peringkasan teks adalah kualitas hasil ringkasan. Salah satu metode untuk meringkas teks yang dikenal adalah metode TF-IDF, metode ini merupakan metode peringkasan dengan pendekatan statistik. Pendekatan lain untuk meringkas teks adalah pendekatan linguistik. Ringkasan dari sebuah teks terdiri atas kalimat-kalimat yang memiliki fitur-fitur linguistik seperti jumlah kata, jumlah kata kunci, dan posisi kalimat pada teks asli. Fitur-fitur tersebut dapat digunakan untuk mengklasifikasikan suatu kalimat baru kedalam kelas ringkasan atau kelas bukan ringkasan. Hasil peringkasan diperoleh dari kumpulan kalimat pada kelas ringkasan. Pada penelitian ini, penulis melakukan penggabungan fitur statistik dan fitur linguistik untuk melakukan peringkasan teks. Hasil pengujian penelitian ini menunjukkan peringkasan dengan fitur statistik dan linguistik menggunakan metode Naïve Bayes memiliki nilai rata-rata f-score 0,206 dan nilai rata-rata relative utility 0,116.

English Abstract

In this era which require big amount of data, text summarization becomes a needs. With text summarization, everyone can get information that describe all of big text in just few of sentences. The problem in text summarization is quality of the summarization result. One of the known method for text summarization is TF-IDF, this method is a method for summarizing text using statistical approach. The other approach for summarizing text is statistical approach. In a general way, summarization result is consist of sentences with statistical features such as total of words, total of keywords, and sentence position in the original text. Those features can be used to classify a text into class of summary or class of non summary. The summarization result come from the composite of every sentence in summary class. In this research, writer combines the use of statistical feature and linguistical features to summarize text. The testing result of this research show that summarization with statistical and linguistical features using Naïve Bayes method came with f-score average 0,206538 and relative utility average 0,116.

Item Type: Thesis (Sarjana)
Identification Number: SKR/FTIK/2017/175/051703831
Subjects: 000 Computer science, information and general works > 005 Computer programming, programs, data
Divisions: Fakultas Ilmu Komputer > Teknik Informatika
Depositing User: Kustati
Date Deposited: 23 May 2017 08:46
Last Modified: 22 Oct 2021 03:45
URI: http://repository.ub.ac.id/id/eprint/147397
[thumbnail of Muhammad_Fhadli___135150201111004___Skripsi.pdf]
Preview
Text
Muhammad_Fhadli___135150201111004___Skripsi.pdf

Download (3MB) | Preview

Actions (login required)

View Item View Item