Febriana, Resti (2018) Klasifikasi Berita Pada Twitter Dengan Menggunakan Metode Naϊve Bayes Dan Feature Expansion Berbasis Cosine Similarity. Sarjana thesis, Universitas Brawijaya.
Abstract
Informasi telah menjadi hal yang sangat dibutuhkan di era modern ini, terlebih dengan adanya berbagai media sosial yang mendukung perbaruan informasi. Twitter sebagai salah satu media sosial yang aktif digunakan untuk memperbarui informasi yang tergolong dalam short text atau berita pendek yang memiliki beberapa kesulitan ketika dilakukan klasifikasi, seperti kata yang ambigu, kata yang terdapat dalam data uji tidak pernah muncul dalam data latih dan sebagainya. Penelitian ini dilakukan untuk mengetahui pengaruh penggunaan feature expansion atau penambahan kata pada short text dalam hasil klasifikasi. Sebelum dilakukan klasifikasi, terlebih dahulu data yang akan diujikan ditambahkan dengan daftar kata yang telah dibuat sebelumnya sebagai sumber eksternal atau kamus dengan batasan tertentu yang telah ditetapkan. Batasan ini bertujuan untuk mengetahui nilai batasan minimal yang paling optimal dalam menghasilkan akurasi tertinggi dalam proses klasifikasi. Dalam proses pembuatan sumber eksternal dilakukan proses cosine similarity untuk mencari kedekatan antar kata. Hasil penelitian berupa akurasi yang menunjukkan adanya pengaruh penambahan feature expansion dalam hasil klasifikasi, hasil akurasi sebesar 83% pada klasifikasi tanpa penggunaan feature expansion dan meningkat menjadi 87% pada penggunaan feature expansion dengan nilai threshold 0,9.
English Abstract
Information has become indispensable in this modern era, especially with the existence of various social media that support information update. Twitter as one of the most active social media is used to update information belonging to short text or short stories that have some difficulty when done classification, such as ambiguous word, the word contained in the test data never appear in the data train and so on. This research was conducted to determine the effect of using feature expansion or addition of word on short text in the result of classification. Prior to classification, the first data to be tested is added to the list of pre-made words as an external source or dictionary with specified limits. This limitation aims to determine the minimum value of the most optimal limit in generating the highest accuracy in the classification process. In the process of making external sources cosine similarity process is done to find the closeness between words. The result of this research is accurate showing effect of expansion of feature expansion in classification result, 83% accuracy in classification without feature expansion and increased to 87% on feature expansion with threshold value 0.9.
Item Type: | Thesis (Sarjana) |
---|---|
Identification Number: | SKR/FTIK/2018/665/051808578 |
Uncontrolled Keywords: | cosine similarity, feature expansion, klasifikasi berita, naϊve bayes, short text, threshold |
Subjects: | 300 Social sciences > 302 Social interaction > 302.3 Social interaction within groups > 302.302 85 Computer aplications |
Divisions: | Fakultas Ilmu Komputer > Teknik Informatika |
Depositing User: | Budi Wahyono Wahyono |
Date Deposited: | 13 Mar 2019 04:08 |
Last Modified: | 22 Oct 2021 01:41 |
URI: | http://repository.ub.ac.id/id/eprint/13642 |
Preview |
Text
Resti Febriana.pdf Download (2MB) | Preview |
Actions (login required)
View Item |