Penerapan Analisis Sentimen Untuk Menilai Suatu Produk Pada Twitter Berbahasa Indonesia Dengan Metode Naïve Bayes Classifier Dan Information Gain

Attabi, Ahmad Wildan ’ (2018) Penerapan Analisis Sentimen Untuk Menilai Suatu Produk Pada Twitter Berbahasa Indonesia Dengan Metode Naïve Bayes Classifier Dan Information Gain. Sarjana thesis, Universitas Brawijaya.

Abstract

Twitter memiliki peran besar dalam mempengaruhi aspek dari segi sosial, komunikasi, psikologi, marketing, dan politik. Kiriman Tweet komentar atau opini secara tidak langsung akan menjadi sebuah review terhadap penilaian pada suatu produk tersebut. Salah satu sektor produk yang sangat diminati oleh banyak orang saat ini adalah produk kecantikan dan perawatan kulit. Mereka mencari produk yang memiliki kualitas terbaik dengan cara melihat pendapat dari orang lain, sehingga mereka memiliki gambaran yang mempengaruhi minat mereka atas pendapat orang lain yang disampaikan lewat Twitter terkait hasilnya setelah memakai produk tersebut. Analisis sentimen dapat membantu dalam menganalisis dan mengklasifikasikan menjadi kelas positif dan kelas negatif dari pendapat orang yang ada di twitter terkait produk yang bersangkutan untuk dicari nilai kecenderungan pasarnya dan kualitas produk pada pandangan publik. Opini dan komentar terkait produk Mustika Ratu dipilih untuk mewakili obyek penelitian ini, dengan alasan pertumbuhan ekonomi dan banyaknya pengguna dari Musitka ratu yang merupakan perusahaan di bidang perawatan kult dan kecantikan. Metode Naïve Bayes Classifier dipilih untuk alasan kemudahan dalam implementasinya, dan memiliki performa cepat dalam melatih, sedangkan penambahan Information Gain diperlukan untuk proses seleksi fitur dengan mengurangi keberadaan kata yang tidak relevan pada data yang digunakan. Pengujian dilakukan dengan jumlah data sebanyak 200 (100 dokumen positif, dan 100 dokumen negatif) menggunakan kisaran nilai threshold : 0, 0.01, 0.02, 0.03, 0.04, 0.05, 0.06, 0.07, 0.08, 0.09, dan 0.10. Hasil yang diperoleh terdapat peningkatan akurasi dengan selisih 4%, nilai rata-rata akurasi jika tanpa menggunakan metode Information Gain (threshold 0) sebesar 70%, sedangkan dengan menggunakan metode Information Gain (threshold 0.01) sebesar 74%. Hal ini dipengaruhi oleh beberapa faktor diantaranya jumlah data latih dan persebaran jenis kata pada data latih dokumen positif maupun dokumen negatif. Nilai akurasi yang paling tinggi didapatkan pada K1 (threshold 0.02), kemudian K5, K6 (threshold 0.01), dan K7 (threshold 0.02 dan 0,08) dengan presentase 85%, sedangkan pada k bagian tertentu dengan threshold tertentu memperoleh titik terendah sebesar 50%.

English Abstract

Twitter has a major role in the development of social, communication, psychological, marketing and political aspects. Posts Tweet comments or review indirectly will be a review of the assessment on a product. One of the most sought after products sectors today is beauty and skin care products. They look for products that they share with others, so they have a picture that affects their interest on the opinions of others who delivered via Twitter related results after using the product. Sentiment analysis can help in analyzing and classifying into positive and negative terms of twitter-related opinions about product trends and product quality in the public view. Opinions and comments related to Mustika Ratu's products are the subject of this study, citing the economic growth and the large number of users of Musitka Ratu who are companies in the field of beauty and beauty care. The Naïve Bayes Classifier method is selected for implementation use, and has a fast performance in training, while the addition of Information is required for the feature selection process by reducing the presence of irrelevant words in the data used. The test is performed with 200 data (100 positive documents, and 100 negative documents) using the thresholds : 0, 0.01, 0.02, 0.03, 0.04, 0.05, 0.06, 0.07, 0.08, 0.09, dan 0.10. The results obtained are adjusted for a difference of 4%, the highest average value if no Information Gain (threshold 0) is 70%, while using Information Gain (threshold 0.01) equal to 74%. This is influenced by several factors such as the amount of data and data that spread from data data and documents. The highest accuracy value is obtained at K1 (threshold 0,02), then K5, K6 (threshold 0.01), and K7 (threshold 0,02 and 0,08) with percentage 85%, while at k with threshold at the lowest point 50%.

Other obstract

-

Item Type: Thesis (Sarjana)
Identification Number: SKR/FTIK/2018/307/051804120
Uncontrolled Keywords: Analisis Sentimen, Naive Bayes, Information Gain, Twitter, Mustika Ratu. Analysis Sentiment, Naive Bayes, Information Gain, Twitter, Mustika Ratu.
Subjects: 300 Social sciences > 381 Commerce (Trade) > 381.1 Marketing channels > 381.14 Retail channels by merchandising pattern > 381.142 Teleshopping
Divisions: Fakultas Ilmu Komputer > Teknik Informatika
Depositing User: Budi Wahyono Wahyono
Date Deposited: 04 Mar 2019 03:36
Last Modified: 30 Nov 2021 03:25
URI: http://repository.ub.ac.id/id/eprint/13385
[thumbnail of Ahmad Wildan Attabi’.pdf]
Preview
Text
Ahmad Wildan Attabi’.pdf

Download (4MB) | Preview

Actions (login required)

View Item View Item