Klasifikasi Teks Pengaduan Pada Sambat Online Menggunakan Metode N-Gram Dan Neighbor Weighted K-Nearest Neighbor (NW-KNN)

Prasanti, Annisya Aprilia (2017) Klasifikasi Teks Pengaduan Pada Sambat Online Menggunakan Metode N-Gram Dan Neighbor Weighted K-Nearest Neighbor (NW-KNN). Sarjana thesis, Universitas Brawijaya.

Abstract

SAMBAT Online merupakan salah satu bentuk nyata E-Government berupa aplikasi pengaduan berbasis website yang disediakan oleh Dinas Komunikasi dan Informatika Kota Malang (Diskominfo Malang). Suatu teks pengaduan yang masuk akan dikategorikan ke dalam berbagai bidang SKPD yang bertanggung jawab. Untuk mempermudah mengorganisir teks pengaduan dan meningkatkan efisiensi waktu super admin dalam memilah dan menentukan bidang SKPD tujuan, diperlukan sebuah metode klasifikasi teks. NW-KNN merupakan algoritme pengembangan dari algortime KNN tradisional. Umumnya, perhitungan jarak tetangga terdekat yang digunakan pada algoritme NW-KNN menggunakan Cosine Similarity dengan ekstraksi fitur bag of words. Bag of words merupakan ekstraksi fitur yang tidak memperhatikan urutan kata sebuah kalimat. Untuk menyempurnakan kekurangan tersebut, pada penelitian ini akan digunakan metode pendukung untuk ekstrasi fitur yaitu metode N-Gram. Hasil pengujian dalam penelitian ini menunjukkan bahwa penggunaan metode NW-KNN dengan nilai tetangga k = 3 dan metode N-Gram dengan Unigram memiliki nilai f-measure tertinggi sebesar 75.25%.

English Abstract

SAMBAT Online is a concrete application of E-Government in a web-based platform for complaints provided by Dinas Komunikasi dan Informatika Kota Malang (Diskominfo Malang). An incoming complaint text will be categorized into various areas of the SKPD. With that being said, in order to make the job of the super admin easier in organizing and determining an SKPD category, as well to organize a complaint text and improve the time efficacy, a method of text classification is paramount. NW-KNN is an upgraded algorithm of the traditional KNN algorithm. Generally, the closest neighboring distance calculations will use Cosine Similarity with bag of words for feature extraction. Bag of words is a feature extraction that ignores the order of words of a sentence altogether. To improve the algorithm despite the deficiency, this research will use supporting method for feature extraction, which is called as N-Gram. The result in this research indicated that NW-KNN with neighboring value k = 3 and N-Gram with Unigram have the highest f-measure’s value with 75.25%.

Item Type: Thesis (Sarjana)
Identification Number: SKR/FTIK/2017/398/051706745
Uncontrolled Keywords: Klasifikasi Teks, Text Mining, Neighbor Weighted K-Nearest Neighbor, N-Gram
Subjects: 000 Computer science, information and general works > 001 Knowledge > 001.012 Classification
Divisions: Fakultas Ilmu Komputer > Teknik Informatika
Depositing User: Yusuf Dwi N.
Date Deposited: 23 Aug 2017 04:08
Last Modified: 03 Dec 2021 06:42
URI: http://repository.ub.ac.id/id/eprint/1571
[thumbnail of Annisya Aprilia Prasanti.pdf]
Preview
Text
Annisya Aprilia Prasanti.pdf

Download (6MB) | Preview

Actions (login required)

View Item View Item