Klasifikasi Dokumen Sambat Online Menggunakan Metode K-Nearest Neighbor Dan Features Selection Berbasis Categorical Proportional Difference

Sari, Nur Hijriani Ayuning (2017) Klasifikasi Dokumen Sambat Online Menggunakan Metode K-Nearest Neighbor Dan Features Selection Berbasis Categorical Proportional Difference. Sarjana thesis, Universitas Brawijaya.

Abstract

Sambat Online merupakan fasilitas yang berfungsi untuk menampung saran, kritik, keluhan atau pertanyaan dari masyarakat kota Malang seputar Pemerintah Kota Malang melalui situs web yang sudah disediakan atau melalui pesan singkat kepada nomor yang sudah disediakan. Suatu teks pengaduan yang masuk akan dikategorikan ke dalam berbagai bidang SKPD yang bertanggung jawab, untuk mempermudah mengorganisir teks pengaduan dan meningkatkan efisiensi waktu super admin dalam memilah dan menentukan bidang SKPD tujuan maka perlu dibuat sistem cerdas yang dapat mengklasifikasikan dokumen sesuai tujuan. Proses yang dilakukan adalah mengumpulkan dokumen latih dan dokumen uji, melakukan tahap preprocessing, seleksi fitur, metode seleksi fitur yang digunakan adalah menggunakan metode Categorical Proportional Difference (CPD) untuk mengukur derajat kontribusi sebuah kata. Metode Categorical Proportional Difference akan memprediksi ada atau tidak adanya term dalam sebuah dokumen sehingga term yang sering muncul memiliki nilai CPD yang rendah sedangkan term yang jarang muncul atau hanya muncul pada salah satu kategori saja memiliki nilai CPD yang tinggi. Term dengan nilai CPD yang tinggi akan dapat digunakan untuk proses klasifikasi, pembobotan, kemudian dilakukan klasifikasi menggunakan KNearest Neighbor (K-NN) merupakan metode klasifikasi untuk mencari dokumen yang memiliki kedekatan antara dokumen, dan pada tahap akhir dilakukan pengujian dan analisis terhadap hasil klasifikasi oleh sistem terkait nilai accuracy, precision, recall, dan F-Measure. Hasilnya kinerja yang paling optimal adalah penggunaan k=1 dengan feature sebanyak 100% sebesar 91,84%, yang mana nilai akurasinya lebih baik dibandingkan dengan adanya seleksi fitur yaitu ketika penggunaan feature sebanyak 50% sebesar 61.22%, hal ini terjadi karena adanya penghapusan term yang memiliki nilai CPD yang rendah.

English Abstract

Sambat Online is a platform to facilitate the suggestions, criticisms, complaints or questions from the public to the Government of Malang through provided websites or via short messages. Incoming complaints, then will be categorized into various fields of SKPD. To make it easier to organize the text and increase the efficiency of the super admin in sorting out and define the field of SKPD, an intelligent systems that can classify documents according to its SKPD’s field is needed. Started from collecting the test documents and training documents, continue to the preprocessing stage and selection features. Feature selection methods that is used are Categorical Proportional Difference (CPD) to measure the degree of contribution of a word. Categorical Proportional Difference method will predict the presence or absence of a term in a document so that a term that often appears will have a low CPD value whilst the term that rarely appears or appears only on one of the categories will have high value. Term with high value of CPD will be used for the classification process, weighting, and then do the classification K-Nearest Neighbor (K-NN) is a method of classification that will be used to find similarities between documents, and in the final stages of testing and analysing the results of the classification system by value of accuracy, precision, recall, and F-Measure. The result is the most optimal performance is the use of k = 1 with featured as much as 100% of 91.84%, which shows better value compared to the featured selection due to the removal of the term with low CPD value.

Item Type: Thesis (Sarjana)
Identification Number: SKR/FTIK/2017/758/051711461
Uncontrolled Keywords: Klasifikasi Dokumen, K-Nearest Neighbor, Categorical Proportional Difference
Subjects: 000 Computer science, information and general works > 001 Knowledge > 001.012 Classification
Divisions: Fakultas Ilmu Komputer > Teknik Informatika
Depositing User: Yusuf Dwi N.
Date Deposited: 04 Jan 2018 07:24
Last Modified: 20 Jun 2022 06:49
URI: http://repository.ub.ac.id/id/eprint/7722
[thumbnail of Nur Hijriani Ayuning Sari.pdf] Text
Nur Hijriani Ayuning Sari.pdf

Download (10MB)

Actions (login required)

View Item View Item