Prabowo, Dhimas Anjar (2017) Peringkasan Teks Ekstraktif Kepustakaan Ilmu Komputer Bahasa Indonesia Menggunakan Metode Normalized Google Distance Dan K-MEANS. Sarjana thesis, Universitas Brawijaya.
Abstract
Semakin cepatnya peningkatan jumlah data digital setiap tahunnya menyebabkan seseorang menjadi sulit untuk dapat membaca keseluruhan informasi yang ada. Salah satu contoh data digital tersebut adalah data teks dokumen, yang dapat berupa dokumen penelitian. Permasalahan tersebut mendorong urgensi diperlukannya sebuah teknik otomatis yang dapat menyajikan informasi bermanfaat dengan ringkas dan jelas. Di mana salah satu solusi dari permasalahan tersebut adalah dengan teknik peringkasan teks. Penelitian ini menggunakan algoritme Normalized Google Distance (NGD) dan K-means dalam penerapan teknik peringkasan teksnya, dengan objek penelitian yaitu dokumen kepustakaan ilmu komputer berbahasa Indonesia. Di mana NGD digunakan sebagai algoritme untuk medapatkan kalimat-kalimat yang berkaitan dengan judul dari dokumen dan K-means digunakan sebagai algoritme untuk mendapatkan kalimat ringkasan yang berasal dari berbagai topik bahasan yang terkandung dalam dokumen. Hasil pengujian dari penelitian ini menunjukkan bahwa peringkasan teks menggunakan metode NGD dan K-means mendapati nilai rata-rata akurasi precision, recall, dan relative utility terbaik secara berurutan pada pakar pertama sebesar 0,20, 0,47, 0,48 dan pada pakar kedua sebesar 0,27, 0,43, 0,45. Serta mendapati nilai rata-rata kappa sebesar 0,41 atau moderate.
English Abstract
The yearly rapid increase of digital data surface a difficulties for a person to be able to read every information that was served. One example of its data was a textual data document, which could be in a form of research document. This problem urges for a solution that is a technique to present all of the information in a clear and concise form, and one of its solution is a text summarization technique. This research proposed a text summarization technique using Normalized Google Distance (NGD) and K-means as its extractive algorithm, with a textual data that is a research document based on computer science studies in Indonesian language as its research object. NGD will be used as an algorithm to derive sentences that was related to its document’s title, and K-means will be used as an algorithm to obtain important sentences by its several topics that occurs in the document. The experiment result showed that this research possess an average best of precision, recall, and relative utility measures scores by 0.27, 0.43, and 0.45 respectively. In the other hand, the experiment result also showed that this research possess an average of kappa measure score by 0.41 or moderate.
Item Type: | Thesis (Sarjana) |
---|---|
Identification Number: | SKR/FTIK/2017/341/051706383 |
Uncontrolled Keywords: | peringkasan teks ekstraktif, Normalized Google Distance, K-means |
Subjects: | 000 Computer science, information and general works > 004 Computer science |
Divisions: | Fakultas Ilmu Komputer > Teknik Informatika |
Depositing User: | Kustati |
Date Deposited: | 23 Aug 2017 07:25 |
Last Modified: | 28 Nov 2020 03:06 |
URI: | http://repository.ub.ac.id/id/eprint/1574 |
Text
Bagian Depan (1).pdf Restricted to Repository staff only Download (3MB) |
|
Text
BAB I.pdf Restricted to Repository staff only Download (292kB) |
|
Text
BAB II.pdf Restricted to Repository staff only Download (350kB) |
|
Text
BAB III.pdf Restricted to Repository staff only Download (285kB) |
|
Text
BAB IV.pdf Restricted to Repository staff only Download (918kB) |
|
Text
BAB V.pdf Restricted to Repository staff only Download (1MB) |
|
Text
BAB VI.pdf Restricted to Repository staff only Download (362kB) |
|
Text
BAB VII.pdf Restricted to Repository staff only Download (270kB) |
|
Text
Daftar Pustaka.pdf Restricted to Repository staff only Download (282kB) |
Actions (login required)
View Item |