Klasifikasi Dokumen Abstrak Skripsi Berdasarkan Fokus Penelitian Di Bidang Komputasi Cerdas Menggunakan Bm25 Dan K-Nearest Neighbor

Binawan, Deri Hendra (2019) Klasifikasi Dokumen Abstrak Skripsi Berdasarkan Fokus Penelitian Di Bidang Komputasi Cerdas Menggunakan Bm25 Dan K-Nearest Neighbor. Sarjana thesis, Universitas Brawijaya.

Abstract

Salah satu proses yang dapat dilakukan di text mining adalah pengelompokan dokumen teks. Permasalahan yang berkaitan dengan pengelompokan dokumen teks ditemukan di perguruan tinggi khususnya di ruang baca Fakultas Ilmu Komputer Universitas Brawijaya (FILKOM UB). Permasalahannya adalah belum adanya proses pengelompokan dokumen skripsi secara otomatis. Pengelompokan dokumen skripsi di ruang baca FILKOM UB masih belum tertata sesuai dengan fokus penelitian yang ada. Pengelompokan tersebut dapat diselesaikan menggunakan metode BM25 dan K-Nearest Neighbor. Proses yang dilakukan adalah melakukan pre-processing dokumen, perhitungan score BM25 tiap dokumen, dan proses klasifikasi menggunakan algoritme K-Nearest Neighbor. Proses pengujian pada penelitian ini menggunakan k-fold sebanyak 10. Setiap pengujian menggunakan data testing sebanyak 31 dokumen dan data training sebanyak 300 dokumen. Hasil rata-rata yang diperoleh pada tiap pengujian menghasilkan hasil terbaik pada nilai k=11 dengan nilai f-measure sebesar 0,9092, recall sebesar 0,9087, dan precision sebesar 0,9265, sedangkan untuk nilai k yang semakin besar, hasil f-measure, recall, dan precision mengalami penurunan. Oleh karena itu, metode BM25 dan K-Nearest Neighbor dapat diterapkan pada proses klasifikasi dokumen abstrak skripsi berdasarkan fokus penelitian di bidang Komputasi Cerdas dan untuk hasil yang klasifikasi pada penelitian ini berada pada nilai k yang kecil, untuk nilai k yang semakin besar proses klasifikasi berjalan kurang maksimal

English Abstract

One of the process that can be implemented in text mining is categorizing text documents. Problems that related the categorizing text documents are found in universities, especially in the reading room of the Faculty of Computer Science, Universitas Brawijaya (FILKOM UB). There is no process for categorizing thesis documents automatically is one of the problem. The thesis documents categorization in FILKOM UB's reading room is still not organized according to the focus of the existing research. The categorization is completed using the BM25 and K-Nearest Neighbor methods. The process was done is pre-processing text document, calculate the BM25 score of each document, then classify them using the K-Nearest Neighbor algorithm. The testing process in this research uses 10 kfold. Each test used 31 testing documents and 300 training documents. The average results obtained in each test produced the best results at the value of k=11 with a f-measure value is 0.9092, recall is 0.9087, and precision is 0.9265. The greater the value of k cause the classification process runs less optimally because it produces a smaller f-measure value

Other obstract

-

Item Type: Thesis (Sarjana)
Identification Number: SKR/FILKOM/2019/121/051902291
Uncontrolled Keywords: klasifikasi, Text Mining, BM25, K-Nearest Neighbor, dokumen abstrak skripsi, classification, Text Mining, BM25, K-Nearest Neighbor, thesis abstract document
Subjects: 000 Computer science, information and general works > 001 Knowledge > 001.012 Classification
Divisions: Fakultas Ilmu Komputer > Teknik Informatika
Depositing User: Nur Cholis
Date Deposited: 01 Aug 2020 04:50
Last Modified: 24 Oct 2021 03:55
URI: http://repository.ub.ac.id/id/eprint/169247
[thumbnail of Deri Hendra Binawan (2).pdf]
Preview
Text
Deri Hendra Binawan (2).pdf

Download (2MB) | Preview

Actions (login required)

View Item View Item