Irfani, Fakhruddin Farid (2018) Klasifikasi Berita pada Twitter Menggunakan Metode Naive Bayes dan Query Expansion Hipernim-Hiponim. Sarjana thesis, Universitas Brawijaya.
Abstract
Banyaknya jumlah tweet yang di-post mengakibatkan tweet yang tersebar dan muncul dalam beranda Twitter sangat beragam dan tidak dikelompokkan berdasarkan kategori beritanya seperti kesehatan, olahraga, teknologi, ekonomi, wisata dan lain sebagainya. Tidak adanya pengkategorian menyebabkan pengguna kesulitan jika ingin membaca atau mengambil informasi terkait kategori tertentu yang diinginkan. Salah satu solusi yang dapat dilakukan adalah dengan metode klasifikasi teks, yang dalam proses klasifikasinya mampu mengklasifikasikan secara otomatis terhadap beberapa kategori pada teks tidak terstruktur dengan Bahasa alami. Pada penelitian ini dilakukan proses klasifikasi menggunakan metode Naive Bayes dengan tambahan query expansion untuk menambahkan term pada dokumen awal. Penambahan term bertujuan untuk mengoptimalkan proses klasifikasi dikarenakan tweet merupakan short text yang dapat menimbulkan ambiguitas kelas klasifikasi. Penambahan yang dilakukan adalah hiponim dan hipernim dari dokumen asli yang diambil dari WordNet. Metode perhitungan akurasi yang digunakan adalah k-fold yang bertujuan untuk menguji kehandalan dari sistem. Akurasi yang didapatkan adalah sebesar 72% untuk klasifikasi tanpa query expansion, 65,75% untuk penambahan hiponim dan hipernim, 66,3% untuk penambahan hiponim saja, dan 67,5% untuk penambahan hipernim saja. Dapat disimpulkan bahwa penambahan query yang dilakukan kurang efektif untuk meningkatkan akurasi proses klasifikasi.
English Abstract
The large number of posted tweets resulted in scattered tweets and appearing on the Twitter homepage very diverse and not classified by categories such as health, sports, technology, economics, tourism and so on. The absence of categorization causes the user difficulty to read or retrieve information related to certain desired categories. Ssolution that can be done is by the method of text classification, which in the process of classification is able to classify automatically against some categories on unstructured text with natural language. In this research will be done classification process using Naive Bayes method with additional query expansion to add term in initial document. The addition of term aims to optimize the classification process because the tweet is a short text that can lead to ambiguity of classification classi. The additions made are hyponym and hypernym from original documents extracted from WordNet. Accuracy calculation method used is k-fold that aims to test the robustness of system. The accuracy obtained was 72% for the classification without query expansion, 65.75% for hyponym and hypernym addition, 66.3% for hyponym addition, and 67.5% for hypernym addition. It can be concluded that the addition of queries made less effective to improve the accuracy of the classification process.
Item Type: | Thesis (Sarjana) |
---|---|
Identification Number: | SKR/FTIK/2018/493/051808302 |
Uncontrolled Keywords: | Tweet, Naive Bayes, WordNet, Hiponim, Hipernim, K-Fold |
Subjects: | 300 Social sciences > 302 Social interaction > 302.3 Social interaction within groups > 302.302 85 Computer aplications |
Divisions: | Fakultas Ilmu Komputer > Teknik Informatika |
Depositing User: | Budi Wahyono Wahyono |
Date Deposited: | 22 Mar 2019 00:59 |
Last Modified: | 21 Oct 2021 02:01 |
URI: | http://repository.ub.ac.id/id/eprint/13805 |
Preview |
Text
Fakhruddin Farid Irfani.pdf Download (7MB) | Preview |
Actions (login required)
View Item |