Prediksi Rating Otomatis Pada Review Produk Dengan Metode Contextual Valence Shifters, K-Nearest Neighbor (K-Nn), dan Regresi Linear

Satria, Ahmad Galang (2019) Prediksi Rating Otomatis Pada Review Produk Dengan Metode Contextual Valence Shifters, K-Nearest Neighbor (K-Nn), dan Regresi Linear. Sarjana thesis, Universitas Brawijaya.

Abstract

Penggunaan media komunikasi yang semakin berkembang membuat informasi mudah untuk didapatkan termasuk informasi pada produk-produk yang disediakan di toko-toko online. Fitur rating pada website merupakan cara untuk melihat kualitas dari produk yang akan dibeli agar tidak salah pilih dalam pembelian produk yang dapat berakibat buruk. Melimpahnya data tentang ulasan produk dalam berbagai sumber online berguna sebagai bahan kajian bagi pihak produsen dalam memperbaiki kualitas produk. Adanya data ulasan yang ditemukan tanpa disertai dengan rating membuat produsen mengalami kesulitan untuk menentukan ulasan kedalam sentiment tertentu. Pada penelitian ini dapat mempercepat penentuan ulasan kedalam sentiment yang berbentuk rating. Penelitian ini menggunakan metode regresi linear dan k-nearest neighbor sebagai metode prediksi serta metode pembobotan contextual valence shifter berdasarkan kamus lexicon setelah pre-processing. Penggunaan n-gram meliputi unigram, bigram dan trigram yang bertujuan meningkatkan hasil akurasi sistem. Didapatkan presentase terbesar pada toleransi 1 dengan hasil yang diperoleh trigram lebih besar dari pada bigram maupun unigram dengan metode regresi linear yaitu akurasi 77% sedangkan k-NN mendapatkan akurasi sebesar 75% pada nilai k=20 dan k=30. Hasil pengujian menunjukkan, penggunaan n-gram khususnya bigram dan trigram berdampak positif pada hasil akurasi sistem.

English Abstract

The growing use of communication media makes information easy to obtain including information on products provided in online stores. The rating feature on the website is a way to see the quality of the product to be purchased so as not to make a wrong choice when purchasing a product that can have a bad impact. Abundant data about product reviews in various online sources are useful as study material for producers in improving product quality. The existence of review data that is found without accompanying the rating makes it difficult for producers to determine the review into a particular sentiment. In this study can accelerate the determination of reviews into sentiment in the form of rating. This study uses a linear regression method and k-nearest neighbor as a prediction method and the method of weighting the contextual valence shifter based on the lexicon dictionary after pre-processing. The use of n-gram includes unigram, bigram, and trigram aimed at increasing the accuracy of the system. The greatest percentage is obtained at tolerance 1 with the results obtained by trigrams greater than bigram or unigram with linear regression method, namely 77% accuracy while k-NN gets 75% accuracy at k = 20 and k = 30. The test results show the use of n-grams, especially bigram and trigram has a positive impact on the results of system accuracy.

Other obstract

-

Item Type: Thesis (Sarjana)
Identification Number: SKR/FILKOM/2019/604/051907796
Uncontrolled Keywords: prediksi rating, review contextual valence shifters, k-nearest neighbor, regresi linear, rating prediction, review, contextual valence shifters, k-nearest neighbor, regresi linear
Subjects: 000 Computer science, information and general works > 003 Systems > 003.2 Forecasting and forecasts
Divisions: Fakultas Ilmu Komputer > Teknik Informatika
Depositing User: Budi Wahyono Wahyono
Date Deposited: 10 Aug 2020 06:52
Last Modified: 19 Oct 2021 06:12
URI: http://repository.ub.ac.id/id/eprint/173983
[thumbnail of Ahmad Galang Satria.pdf]
Preview
Text
Ahmad Galang Satria.pdf

Download (2MB) | Preview

Actions (login required)

View Item View Item