Klasifikasi Teks Bahasa Indonesia Pada Dokumen Pengaduan Sambat Online Menggunakan Metode K-Nearest Neighbors (K-NN) Dan Chi-Square

Suharno, Claudio Fresta (2017) Klasifikasi Teks Bahasa Indonesia Pada Dokumen Pengaduan Sambat Online Menggunakan Metode K-Nearest Neighbors (K-NN) Dan Chi-Square. Sarjana thesis, Universitas Brawijaya.

Abstract

K-Nearest Neighbors (K-NN) merupakan metode klasifikasi yang mudah untuk dipahami. Akan tetapi metode tersebut memiliki beberapa kekurangan, salah satunya adalah metode ini menggunakan semua fitur pada perhitungan klasifikasi, yang mengakibatkan rendahnya nilai akurasi yang dihasilkan dikarenakan banyaknya fitur tidak penting yang masuk dalam perhitungan klasifikasi. Oleh karena itu, seleksi fitur digunakan sebagai salah satu cara untuk mengatasi kekurangan tersebut. Teknik seleksi fitur mengurangi jumlah fitur yang tidak relevan dalam klasifikasi teks. Metode seleksi fitur yang digunakan adalah menggunakan metode Chi-Square untuk menghitung tingkat dependensi fitur. Proses yang dilakukan adalah mengumpulkan dokumen latih dan dokumen uji, melakukan tahap preprocessing dan seleksi fitur, kemudian dilakukan klasifikasi, dan pada tahap akhir dilakukan pengujian dan analisis terhadap hasil klasifikasi oleh sistem terkait nilai precision, recall, dan F-Measure. Dari 16 hasil pengujian, didapatkan nilai precision dan recall terbaik didapatkan dengan nilai masing-masing adalah 90% dan 78% pada k = 15 dengan seleksi fitur sebesar 25%. Sedangkan hasil dari F-Measure terbaik didapatkan dengan nilai 78% pada k = 15 dan k = 5 dengan seleksi fitur sebesar 25%. Dari penelitian ini dihasilkan bahwa seleksi fitur dapat meningkatkan nilai F-Measure dalam klasifikasi teks berbahasa Indonesia pada dokumen pengaduan SAMBAT Online dengan menggunakan metode klasifikasi K-Nearest Neighbors.

English Abstract

K-Nearest Neighbors (K-NN) is one classification method that easy to learn. Although, this method has some drawbacks, one of them is this classification could provide a low accuracy casued by a large feature space with irrelevant features among them. Because of that drawback, feature selection is applied to reduce the feature space by reducing number of irrelevant features in text classification. Selection feature method that being used in this experiment is using Chi-Square method. Using Chi-Square method to select important features by measuring dependency level of each feature across classes and documents. The process including in this experiment is collecting training and testing documents, text preprocessing and feature selection, and classification. After classification is being done by the system, we make an observation and analysis towards classification result, including precision, recall, and F-Measure value. From 16 evaluations, the best precision and recall score obtained with 90% precision and 78% recall on k = 15 using 25% feature selection used. While the best F-Measure score obtained with 78% F-Measure on k = 15 and k = 5 using 25% feature selection used. From this experiment, its appear that feature selection take effect in increasing F-Measure value in text classification of SAMBAT Online complaint documents in bahasa using K-Nearest Neighbors classification method.

Item Type: Thesis (Sarjana)
Identification Number: SKR/FTIK/2017/257/051705063
Uncontrolled Keywords: K-NN, Seleksi Fitur, Chi-Square, Dokumen Pengaduan, Klasifikasi Teks
Subjects: 000 Computer science, information and general works > 001 Knowledge > 001.012 Classification
Divisions: Fakultas Ilmu Komputer > Teknik Informatika
Depositing User: Yusuf Dwi N.
Date Deposited: 11 Jul 2017 04:07
Last Modified: 17 Sep 2020 14:48
URI: http://repository.ub.ac.id/id/eprint/119
[thumbnail of Bagian Depan.pdf]
Preview
Text
Bagian Depan.pdf

Download (90kB) | Preview
[thumbnail of BAB I.pdf] Text
BAB I.pdf
Restricted to Repository staff only

Download (50kB)
[thumbnail of BAB II.pdf] Text
BAB II.pdf
Restricted to Repository staff only

Download (221kB)
[thumbnail of BAB III.pdf] Text
BAB III.pdf
Restricted to Repository staff only

Download (76kB)
[thumbnail of BAB IV.pdf] Text
BAB IV.pdf
Restricted to Repository staff only

Download (660kB)
[thumbnail of BAB V.pdf]
Preview
Text
BAB V.pdf

Download (2MB) | Preview
[thumbnail of BAB VI.pdf] Text
BAB VI.pdf
Restricted to Repository staff only

Download (113kB)
[thumbnail of BAB VII.pdf] Text
BAB VII.pdf
Restricted to Repository staff only

Download (33kB)
[thumbnail of Daftar Pustaka.pdf] Text
Daftar Pustaka.pdf
Restricted to Repository staff only

Download (43kB)

Actions (login required)

View Item View Item