Sentiment Analysis Peringkasan Review Film Menggunakan Metode Information Gain Dan K-Nearest Neighbor

Pristiyanti, Ria Ine (2017) Sentiment Analysis Peringkasan Review Film Menggunakan Metode Information Gain Dan K-Nearest Neighbor. Sarjana thesis, Universitas Brawijaya.

Abstract

Review film berisi tentang sebuah opini dari seorang reviewer untuk mendeskripsikan sebuah film. Penilaian mengenai isi dari review film dapat disebut dengan sentiment analysis. Sentiment analysis pada review film terbagi menjadi 2 yaitu berupa review positif dan review negatif. Pengelompokan hasil sentiment analysis dapat dipermudah dengan metode klasifikasi k-nearest neighbor dimana metode ini akan mencari dokumen yang memiliki kedekatan antara dokumen satu dengan yang lainnya. Pada umumnya, data review film memuat isi yang sangat panjang sehingga diperlukan feature selection atau pemangkasan fitur yang berguna untuk mengurangi dimensi pada saat proses klasifikasi. Pada penelitian ini menggunakan metode information gain untuk mengurangi banyak fitur yang digunakan pada saat proses klasifikasi. Metode ini akan memprediksi ada atau tidak adanya term dalam sebuah dokumen sehingga term yang sering muncul memiliki nilai information gain yang rendah sedangkan term yang jarang muncul atau hanya muncul pada salah satu kategori saja memiliki nilai information gain yang tinggi. Term dengan nilai information gain yang tinggi akan dapat digunakan untuk proses klasifikasi. Hasilnya penggunaan seluruh term untuk klasifikasi menghasilkan akurasi sebesar 92% dimana nilai akurasinya lebih baik dibandingkan dengan adanya feature selection karena adanya penghapusan term yang memiliki nilai information gain yang rendah.

English Abstract

The film reviews contain an opinion from a reviewer to describe a movie. Assessment of the content from the film review can be called by sentiment analysis. Sentiment analysis on movie review is divided into 2 parts, which are positive review and negative review. Grouping of sentiment analysis results can be simplified by the k-nearest neighbor classification method where this method will look for documents that have similarity between one to another document. In general, the movie review data contains very long content required by feature selection or pruning feature to reduce dimensions during classification process. In this case, the method of information gain is used to reduce many features during the classification process. This method will predict the presence or absence of term in a document so the term that frequently appear has low information gain value, however for the term that rarely appear or only appear in one category has high information gain value. The term with high information gain value will be able to be used for classification process. The result for using all of term for classification is 92% accuracy where the accuracy value is better than the feature selection due to the elimination of term having low information gain value.

Item Type: Thesis (Sarjana)
Identification Number: SKR/FTIK/2017/420/051707742
Uncontrolled Keywords: Sentiment Analysis, Feature Selection, K-Nearest Neighbor, Information Gain
Subjects: 000 Computer science, information and general works > 006 Special computer methods
Divisions: Fakultas Ilmu Komputer > Teknik Informatika
Depositing User: Yusuf Dwi N.
Date Deposited: 20 Sep 2017 08:09
Last Modified: 28 Dec 2020 15:57
URI: http://repository.ub.ac.id/id/eprint/2813
[thumbnail of Pristiyanti, Ria Ine.pdf]
Preview
Text
Pristiyanti, Ria Ine.pdf

Download (5MB) | Preview

Actions (login required)

View Item View Item