Analisis Sentimen Pada Ulasan “Lazada” Berbahasa Indonesia Menggunakan Bm25 Dan K-Nearest Neighbor (K-Nn) Dengan Perbaikan Kata Menggunakan Jaro Winkler Distance

Wulandari, Desy (2019) Analisis Sentimen Pada Ulasan “Lazada” Berbahasa Indonesia Menggunakan Bm25 Dan K-Nearest Neighbor (K-Nn) Dengan Perbaikan Kata Menggunakan Jaro Winkler Distance. Sarjana thesis, Universitas Brawijaya.

Abstract

Belanja online adalah salah satu cara yang saat ini banyak diminati oleh masyarakat, terutama di Indonesia. Dengan belanja online khususnya di toko Lazada, konsumen tidak perlu menyita banyak waktu dan energi. Karena kemudahan teknologi yang saat ini sudah dapat digunakan dalam berbelanja online. Namun untuk mengetahui kualitas dari sebuah produk, konsumen akan melihat ulasan dari barang yang sudah terjual. Oleh karena itu dengan banyaknya konsumen yang menuliskan ulasan banyak data yang terkumpul sehingga dibutuhkan cara untuk dapat memilah sentimen positif atau negatif dengan dilakukannya perbaikan kata karena banyaknya kesalahan penulisan kata yang sering kita jumpai pada sebuah ulasan. Sehingga dibutuhkan perbaikan kata agar konsumen dapat memahami lebih jelas isi dari sebuah ulasan. Dalam penelitian ini peneliti membuat sistem dengan menggunakan metode Jaro Winkler Distance yang digunakan untuk memperbaiki kata kemudian dilakukan perhitungan scoring dengan BM25, serta klasifikasi dengan K-Nearest Neighbor (KNN). Berdasarkan hasil pengujian mendapatkan nilai accuracy terbaik sebesar 89% dengan nilai F-Measure 88% pada pengujian k-fold ke-2 dengan nilai k = 11. Sehingga penggunaan normalisasi kata pada data latih dan perbaikan kata pada data uji dapat meningkatkan hasil akurasi yang cukup lebih baik dibandingkan tanpa menggunakan perbaikan kata dan tanpa normalisasi data latih.

English Abstract

Online shopping is one way that is currently in great demand by the public, especially in Indonesia. By shopping online, especially at Lazada stores, consumers don't need to spend a lot of time and energy. Because of the ease of technology that can now be used in shopping online. But to find out the quality of a product, consumers will see reviews of items that have been sold. Therefore with the number of consumers who write a lot of data collected so that a way is needed to be able to sort out positive or negative sentiments by doing word repairs because of the many word writing errors that we often encounter on a review. So it needs word repairs so that consumers can understand more clearly the contents of a review. In this study the researchers made the system using the Jaro Winkler Distance method which was used to improve the word and then performed scoring calculations with BM25, as well as the classification with KNearest Neighbor (KNN). Based on the test results get the best accuracy value of 89% with the value of F-Measure 88% in the second k-fold test with a value of k = 11. So the use of word normalization on training data and improvement of words in the test data can increase the results of sufficient accuracy better than without using word repairs and without normalizing training data.

Other obstract

-

Item Type: Thesis (Sarjana)
Identification Number: SKR/FILKOM/2019/212/051902962
Uncontrolled Keywords: analisis sentimen, perbaikan kata, BM25, K-Nearest Neighbor (K-NN), Jaro Winkler Distance, sentiment analysis, Repair Word, BM25, K-Nearest Neighbor (K-NN), Jaro Winkler Distance.
Subjects: 000 Computer science, information and general works > 005 Computer programming, programs, data > 005.7 Data in computer systems > 005.71 Data communications > 005.717 Error-correcting codes
Divisions: Fakultas Ilmu Komputer > Teknik Informatika
Depositing User: Nur Cholis
Date Deposited: 20 Jul 2020 04:12
Last Modified: 24 Oct 2021 05:12
URI: http://repository.ub.ac.id/id/eprint/169492
[thumbnail of DESY WULANDARI_155150201111114 DOKUMEN SKRIPSI (2).pdf]
Preview
Text
DESY WULANDARI_155150201111114 DOKUMEN SKRIPSI (2).pdf

Download (3MB) | Preview

Actions (login required)

View Item View Item