Rahmi, AuliyaAida (2017) Analisis Sentimen Konten Radikal Pada Sosial Media Twitter Berbahasa Indonesia Menggunakan Metode Learning Vector Quantization. Sarjana thesis, Universitas Brawijaya.
Abstract
Twitter merupakan media sosial yang sangat mudah digunakan dalam menyampaikan opini masyarakat tentang bahasan tertentu. Akan tetapi, tidak jarang pengguna menyampaikan opini yang dapat menimbulkan kesalahpahaman. Opini tersebut biasa disebut dengan konten radikal. Penelitian ini mencoba menganalisis tweet berbahasa Indonesia apakah termasuk dalam konten radikal atau tidak. Tweet yang digunakan sebagai data latih dan data uji dipilih secara manual. Kemudian tweet melalui proses text processing untuk menghasilkan bobot data. Pembobotan dilakukan dengan cara memberi nilai kata yang sudah dipisah berdasarkan jenis kata masing-masing, selanjutnya seluruh kata dalam satu tweet dijumlahkan sesuai dengan fitur yang ada. Fitur yang digunakan ada 8 antara lain kata benda positif, kata benda negatif, kata kerja positif, kata kerja negatif, kata keterangan positif, kata keterangan negatif, kata sifat positif dan kata sifat negatif. Bobot data tersebut akan melalui proses klasifikasi menggunakan metode Learning Vector Quantization (LVQ) untuk mengetahui tweet tersebut masuk dalam konten radikal atau tidak. Penelitian ini menggunakan 7 skenario pengujian yang menghasilkan rekomendasi nilai learning rate 0.3, pengali learning rate 0.8, data latih sebanyak 70%, alpha minimum 0.098304. iterasi maksimum 6 dan data latih yang digunakan sesuai urutan id awal. Hasil akurasi yang didapatkan sebesar 90%.
English Abstract
Twitter is a social media that easier to use in convey public opinion on certain topics. However, it is not uncommon users express opinions can lead to missunderstandings. The opinion commonly call the radical content. This study try to analyze Indonesian tweet language is include the radical content or not. Tweet used as training data and data manually is selected. Then tweet via text processing process for generate weight data. Weighting is done by assigning the value of words that have been separate by the type of words each, then all the words in a tweet summed in accordance with the existing features.The features used include positive noun, negative noun, positive verb, negative verb, positive adverbs, negative adverbs, positive adjectives and negative adjectives. The weight of these data will go through the process of classification using Learning Vector Quantization (LVQ) to determine tweet into the radical content or not. This research uses seven test scenario that resulted in a recommendation value of learning rate 0.3, 0.8 multiplier in learning rate, training data in 70%, minimum alpha 0.098304. Six maximum number of iterations and training data are used in the order id start. The accuracy of the results obtained by 90%.
Item Type: | Thesis (Sarjana) |
---|---|
Identification Number: | SKR/FTIK/2017/14/051701110 |
Subjects: | 000 Computer science, information and general works > 005 Computer programming, programs, data |
Divisions: | Fakultas Ilmu Komputer > Teknik Informatika |
Depositing User: | Kustati |
Date Deposited: | 16 Feb 2017 09:55 |
Last Modified: | 22 Oct 2021 03:28 |
URI: | http://repository.ub.ac.id/id/eprint/147358 |
Preview |
Text
Dokumen.pdf Download (6MB) | Preview |
Actions (login required)
View Item |