Analisis Sentimen Tentang Opini Pilkada DKI 2017 Pada Dokumen Twitter Berbahasa Indonesia Menggunakan Naïve Bayes Dan Pembobotan Emoji

Lestari, Agnes Rossi Trisna (2017) Analisis Sentimen Tentang Opini Pilkada DKI 2017 Pada Dokumen Twitter Berbahasa Indonesia Menggunakan Naïve Bayes Dan Pembobotan Emoji. Sarjana thesis, Universitas Brawijaya.

Abstract

Analisis sentimen merupakan cabang dari text mining, fokus utamanya adalah menganalisis dokumen teks. Dokumen teks terkadang mengandung unsur non-tekstual, salah satunya emoji. Emoji merupakan simbol grafis Unicode berupa gambar untuk mengekspresikan perasaan seseorang. Algoritme yang digunakan dalam penelitian ini adalah Naïve Bayes dengan pembaharuan berupa penambahan pembobotan non-tekstual (emoji). Hasil dari pembobotan tekstual dan non tekstual yang dinormalisasi dengan metode Min-max digabungkan disertai nilai konstanta tertentu sehingga menghasilkan sentimen positif maupun negatif. Data diambil dari Twitter tentang Pilkada DKI 2017 sebanyak 900 data tweet. Dari hasil pengujian akurasi, diperoleh 68,52% untuk kondisi pembobotan tekstual, 75,93% untuk pembobotan non-tesktual, dan 74,81% untuk kondisi penggabungan dengan nilai konstanta 0,5 untuk tekstual dan 0,5 untuk non-tekstual. Dari hasil pengujian pengaruh pembobotan non-tesktual disimpulkan bahwa pembobotan non-tekstual berpengaruh terhadap akurasi dan pengklasifikasian, dengan komposisi konstanta pengali terbaik ketika α=0,4 dan β=0,6 sampai dengan α=0,1 dan β=0,9.

English Abstract

Sentiment analysis is a part of text mining, the main focus is to analysis text documents. Sometimes text documents contain non-textual elements, e.g. emojis. Emoji is an Unicode graphic Symbol representation using pictures to express a person's feelings. The algorithm used in this research is Naïve Bayes with renewal in addition of non-textual weighting (emoji). The results of normalised textual and non-textual weightings with Min-Max method will be combined with certain constant values that resulting in both positive and negative sentiments. Data taken from Twitter about 2017 DKI Jakarta elections as much as 900 data tweet. From the accuracy test results, 68.52% were obtained for textual weighting conditions, 74.81% for non-actual weighting, and 73.57% for merging conditions 0.5 for textual and 0.5 for non-textual. From the result of the examination non-textual weighting effect, can be conclude that the non-textual weighting had an effect on the accuracy and classification, with the best multiplier constants when α = 0.4 and β = 0.6 to α = 0.1 and β = 0.9.

Item Type: Thesis (Sarjana)
Identification Number: SKR/FTIK/2017/351/051706393
Uncontrolled Keywords: analisis sentimen, Twitter, Naïve Bayes, pembobotan emoji
Subjects: 000 Computer science, information and general works > 001 Knowledge > 001.012 Classification
Divisions: Fakultas Ilmu Komputer > Teknik Informatika
Depositing User: Kustati
Date Deposited: 22 Aug 2017 04:20
Last Modified: 25 Nov 2020 13:33
URI: http://repository.ub.ac.id/id/eprint/1505
[thumbnail of Agnes Rossi Trisna Lestari.pdf] Text
Agnes Rossi Trisna Lestari.pdf

Download (9MB)

Actions (login required)

View Item View Item