Penerapan Maximum Tf-Idf Normalization Terhadap Metode Knn Untuk Klasifikasi Dataset Multiclass Panichella Pada Review Aplikasi Mobile

Hananto, Billy Kaleb (2018) Penerapan Maximum Tf-Idf Normalization Terhadap Metode Knn Untuk Klasifikasi Dataset Multiclass Panichella Pada Review Aplikasi Mobile. Sarjana thesis, Universitas Brawijaya.

Abstract

Review aplikasi mobile merupakan sumber wacana dari pengembang aplikasi, dimana dari review ini bisa didapat pengetahuan berupa kearah mana aplikasi harus dibawa dan diperbaiki. Review ini sendiri memiliki banyak jenis, baik yang positif ataupun negatif, baik yang memberikan info, atau hanya sekedar menanyakan permasalahan. Diperlukan waktu, usaha dan ketelitian yang cukup tinggi apabila ingin mengklasifikasikan review ini secara manual. Maka dari itu, diperlukan sebuah metode yang dapat mengklasifikasikan secara otomatis review ini, terutama kedalam kategori kategori unik yang diharapkan dapat membantu pengembang dalam mengarahkan aplikasinya, lebih dari sekedar review positif atau negatif, salah satunya adalah 4 kategori review yang dikembangkan oleh Panichella. Selain berbagai macam kategori tersebut, penelitian ini membahas salah satu metode klasifikasi yang cukup populer yaitu Term Frequency – Inverse Document Frequency dan K-Nearest Neighbor. Kombinasi kedua metode ini sering digunakan untuk mengklasifikasikan teks dalam berbagai bidang. Penelitian ini mencoba menerapkan metode bernama Maximum Term Frequency – Inverse Document Frequency, metode normalisasi yang bekerja dengan cara membagi nilai frekuensi dengan jumlah kata terbanyak yang muncul, dengan harapan bahwa metode K-Nearest Neighbor dapat memberikan hasil akurasi yang lebih tinggi dengan diubahnya metode Term Frequency – Inverse Document Frequency ini.

English Abstract

Mobile Application’s Review is a source for application developer to develop their apps into the way user’s want to. There’s multiple type of Mobile Application’s Review itself, from positive review to negative review, from giving information to just stating problems. Time and effort is needed to classify these review manually. Hence, there’s a need for some method to classify these review automatically, especially to unique categories that hopefully can help developer to improve their applications, more than just negative and positive review, one of them being Panichella’s Categories which categorize review into 4 categories. Beside those categories, this research will talk about one classification method that really popular, which is Term Frequency – Inverse Document Frequency and K-Nearest Neighbor. Combination of these two method are usually used to categorize texts. This research will try to apply a method called Maximum Term Frequency – Inverse Document Frequency, normalization technique that works by dividing a Term’s Frequency by it’s Document’s highest number of Term, which hopefully will help increase K-Nearest Neighbor’s accuracy.

Item Type: Thesis (Sarjana)
Identification Number: SKR/FTIK/2018/684/051808597
Uncontrolled Keywords: Klasifikasi, KNN, TF-IDF, Panichella. Classification, KNN, TF-IDF, Panichella.
Subjects: 000 Computer science, information and general works > 005 Computer programming, programs, data > 005.3 Programs > 005.302 87 Testing and measurement
Divisions: Fakultas Ilmu Komputer > Teknik Informatika
Depositing User: Budi Wahyono Wahyono
Date Deposited: 23 Apr 2019 03:08
Last Modified: 22 Oct 2021 02:03
URI: http://repository.ub.ac.id/id/eprint/161758
[thumbnail of Billy Kaleb Hananto.pdf]
Preview
Text
Billy Kaleb Hananto.pdf

Download (2MB) | Preview

Actions (login required)

View Item View Item