AllisMartanWaskito (2010) Pembuatan Judul Otomatis Menggunakan Metode NBL Pada Dokumen Berita Berbahasa Indonesia. Sarjana thesis, Universitas Brawijaya.
Abstract
Pembuatan judul otomatis adalah proses untuk menghasilkan judul dari suatu artikel dokumen berbahasa Indonesia. Tujuannya adalah untuk membantu pembaca dalam menangkap ide utama dari sebuah dokumen tanpa harus membaca keseluruhan dokumen tersebut. Sistem ini mengimplementasikan metode NBL (Naïve Bayesian Approach with Limited Vocabulary) untuk membuat judul dari sebuah dokumen, dimana dokumen yang digunakan berasal dari situs media online surat kabar Kompas.com dan Detik.com. Tahapan-tahapan yang dilakukan dalam sistem ini adalah, pertama dilakukan proses case folding yaitu mengubah semua huruf menjadi huruf kecil, tahap kedua yaitu penguraian kata (tokenizing), tahap ketiga yaitu mengambil kata-kata yang penting dan penghilangan stopword (filtering), tahap keempat yaitu perhitungan frekuensi dari masing-masing kata, tahap kelima yaitu klasifikasi menggunakan metode NBC (Naïve Bayes Classifier), dan tahap yang terakhir yaitu pembuatan judul menggunakan metode NBL. Untuk mengevaluasi efektifitas sistem pembuatan judul, digunakan standar pengukuran precision, recall, dan F1Measure. Hasil pengujian dan evaluasi menunjukkan bahwa dengan menggunakan proses klasifikasi, kata-kata judul yang terpilih lebih spesifik dan membutuhkan waktu yang lebih sedikit daripada pembuatan judul tanpa proses klasifikasi. Pembuatan judul dengan metode NBL menghasilkan nilai F1 Measure sebesar 31% dengan proses klasifikasi dan 37% tanpa proses klasifikasi. Sistem dengan metode NBL ini memiliki kelemahan, yaitu sangat bergantung pada data latih dan terdapat judul bentukan sistem yang kurang bisa dipahami oleh pembaca.
English Abstract
Automatic Title Generation is a process to produce title from an Indonesian document. Objective of this process is to help people to capture a document’s main idea without having to read through the entire document. The system implements NBL (Naïve Bayesian Approach with Limited Vocabulary) approach to produce title from a document, which the document is from Kompas.com and Detik.com. There are some step in this system, first step is the case folding process that changes all letters to lower case, second step is parsing the word (tokenizing), third step is take unique terms and stopword removal (filtering), fourth step is counting each term frequency, fifth step is classification using NBC (naïve Bayes Classifier) approach, and the last step is generate title with NBL approach. To evaluate the effectiveness of the title generation system, using standar measurement consist of precision, recall, and F1 Measure. Test and evaluation results show that the title generation system using classification procuce speciffic title word and short in time . NBL approach can generate title with average F1 Measure 31% with classification process and 37% witout classification process . The system using NBL approach have some weaknesses, which are it rely heavily on the availability of training data and there will be some titles of generated system not readable.
Item Type: | Thesis (Sarjana) |
---|---|
Identification Number: | SKR/MIPA/2010/309/051003681 |
Subjects: | 500 Natural sciences and mathematics > 510 Mathematics |
Divisions: | Fakultas Matematika dan Ilmu Pengetahuan Alam > Matematika |
Depositing User: | Unnamed user with email repository.ub@ub.ac.id |
Date Deposited: | 15 Dec 2010 09:17 |
Last Modified: | 22 Oct 2021 06:31 |
URI: | http://repository.ub.ac.id/id/eprint/152447 |
Preview |
Text
051003681.pdf Download (4MB) | Preview |
Actions (login required)
![]() |
View Item |