Klasifikasi Dokumen pada Laporan Kepolisian dengan Menggunakan Metode BM25 dan Improved K-Nearest Neighbor (IKNN)

Pranata, Ardhimas Ilham Bagus (2019) Klasifikasi Dokumen pada Laporan Kepolisian dengan Menggunakan Metode BM25 dan Improved K-Nearest Neighbor (IKNN). Sarjana thesis, Universitas Brawijaya.

Abstract

Kepolisian Negara Republik Indonesia merupakan salah satu penegak hukum di Negara Kesatuan Republik Indonesia. Salah satu tugas Kepolisian Indonesia adalah memberikan pelayanan kepada masyarakat. Pengaduan tindak kejahatan merupakan salah satu bentuk pelayanan kepada masyarakat yang ditawarkan oleh Kepolisian. Kejahatan dapat terjadi kepada siapa saja tidak peduli pegawai, pelajar, ataupun yang lainnya. Tahapan setelah laporan tindak kejahatan diterima oleh kepolisian adalah diterbitkannya surah penyelidikan dan penyidikan. Namun dalam kurun waktu satu bulan kepolisian mengalami kesulitan untuk mengklasifikasi setiap laporan kepolisian yang masuk. Klasifikasi merupakan sebuah metode yang digunakan untuk mengelompokkan data berdasarkan tingkat kedekatan data uji dengan kumpulan data latih yang tersedia. Tahapan yang dilakukan dalam penelitian ini adalah data uji yang digunakan akan diproses menggunakan pre-processing text yang selanjutnya akan diberikan bobot nilai term frequency berdasarkan kemunculan kata dalam dokumen yang selanjutnya dihitung nilai invers document frequency serta dihitung nilai score BM25 yang kemudian pada langkah yang terakhir adalah klasifikasi dengan menggunakan metode improved k-nearest neighbor. Dalam penelitian ini dilakukan pengujian dengan k-fold cross validation sebanyak 4 pengujian. Pada setiap pengujian k-fold cross validation dilakukan pembagian data yang sama banyak yaitu sebanyak 25 data uji dan 75 data latih pada setiap pengujian k-fold cross validation. Dari keseluruhan hasil pengujian k-fold cross validation didapatkan rata-rata nilai tertinggi sebesar precision=0.95337, recall=0.93138, f-measure=0.93812 dan accuracy=0.95679 pada nilai k yang diberikan pada Improved KNN sebesar 15.

English Abstract

The National Police of the Republic of Indonesia is one of the law enforcers in the Unitary State of the Republic of Indonesia. One of the tasks of the Indonesian Police is to provide services to the community. Accusation of crime is one form of service to the community offered by the Police. Crime can happen to anyone no matter an employee, a student or others. The stage after the report of a crime is received by the police is the issuance of investigation. However, within one month the police had difficulty classifying every police report that received. Classification is a method used to group data based on the level of closeness of test data with available training data sets. The stages carried out in this study are that the test data used will be processed using pre-processing text which will then be given weight of the term frequency based on the occurrence of words in the document, then the inverse document frequency value and score of BM25 then in the last step classification using the improved k-nearest neighbor method. In this study 4 tests were conducted with k-fold cross validation. In each k-fold cross validation test, the same data is divided into 25 test data and 75 training data for each k-fold cross validation test. From the overall results of the k-fold cross validation test, the highest average value of precision=0.95337, recall=0.93138, f-measure=0.93812 and accuracy=0.95679 at the value of k given to Improved KNN is 15.

Other obstract

-

Item Type: Thesis (Sarjana)
Identification Number: SKR/FILKOM/2019/139/051902309
Uncontrolled Keywords: Klasifikasi, Pre-processing text, BM25, Improved K-Nearest Neighbor, K-fold cross validation, Classification, Pre-processing text, BM25, Improved K-Nearest Neighbor, K-fold cross validation.
Subjects: 000 Computer science, information and general works > 001 Knowledge > 001.012 Classification
Divisions: Fakultas Ilmu Komputer > Teknik Informatika
Depositing User: Nur Cholis
Date Deposited: 01 Aug 2020 04:50
Last Modified: 24 Oct 2021 04:08
URI: http://repository.ub.ac.id/id/eprint/168977
[thumbnail of Ardhimas Ilham Bagus Pranata (2).pdf]
Preview
Text
Ardhimas Ilham Bagus Pranata (2).pdf

Download (2MB) | Preview

Actions (login required)

View Item View Item