Iriananda, Syahroni Wahyu (2018) Identifikasi Kemiripan Teks Menggunakan Class Based Indexing Dan Cosine Similarity Untuk Klasifikasi Dokumen Pengaduan. Magister thesis, Universitas Brawijaya.
Abstract
Dewasa ini masyarakat dapat secara mudah berinteraksi dan berkomunikasi dua arah dengan lembaga pemerintahan melalui pemanfaatan teknologi informasi yaitu Sistem Layanan Aspirasi dan Pengaduan Online Rakyat. Penanganan laporan bergantung pada beberapa administrator sistem yang secara manual menganalisis laporan dengan membaca setiap laporan yang masuk. Permasalahan yang ditemukan adalah penentuan kategori pada laporan pengaduan melalui kanal pesan singkat (SMS) tersebut masih dilakukan secara manual. Model pelaporan melalui kanal ini belum menggunakan format khusus, dimana isi laporan dapat memuat informasi kategori, lembaga tujuan, identitas dan nama pengirim, area kerja lembaga dan jumlah karakter dari kanal tersebut yang terbatas. Maka dari itu diperlukan suatu solusi supaya penentuan kategori pada laporan dapat dilakukan secara otomatis dan sistematis Dalam penelitian ini mengusulkan suatu model atau pendekatan yang dapat mengukur dan mengidentifikasi kemiripan dokumen laporan yang dilakukan secara terkomputerisasi yang dapat mengidentifikasi kemiripan antara dokumen laporan baru dengan dokumen yang telah selesai ditangani. Dalam penelitian ini digunakan metode pembobotan kata berbasis kelas (Class-Based Indexing), dan Cosine Similarity untuk menganalisa kemiripan dokumen. Nilai fitur Cosine Similarity berbasis kelas kemudian ditetapkan sebagai set fitur untuk proses klasifikasi teks menggunakan metode K-Nearest Neighbor (K-NN). Berdasarkan hasil pengujian yang telah dilakukan ditemukan bahwa hasil akurasi maksimal yaitu 84%, menggunakan rasio data latih 75% dan data uji 25% nilai Nilai k = 5 memiliki tingkat akurasi yang tinggi yaitu 84,12%
English Abstract
At present, communities can interact and communicate in two directions with government agencies through the use of information technology, "Aspiration, Complaints And Opinion Handling System" which is called “LAPOR”. The report handling depends on system officials who determine the report by reading each incoming report. This work found the problem on handling sms report to select a category in the complaint report through a Short Message Service (SMS) channel that analyzes manual. The reporting form through this channel has not yet implemented a specific model, where the contents of the report can contain information about the category, agency destination, sender identity, agency work area, and character limits from the channel. Thus, it needs a solution so that the category in the report can be defined automatically and computerized efficiently This research suggests a model or a measurable approach and a similarity between computerized reporting documents and can find similarities between the new report document and the completed document. In this paper, this task applied the class-based indexing method (category-based indexing) and Cosine's similarity to document similarity analysis. The similarities determined by grade as a distinct group for text classification using the K-Nearest Neighbor (K-NN) method. Based on the results, this work found the greatest 84% accuracy, using 75% of the training data and test data 25% and value of K = 5, obtain a high accuracy of 84.12%
Other obstract
-
Item Type: | Thesis (Magister) |
---|---|
Identification Number: | TES/006.312/IRI/i/2018/041808387 |
Uncontrolled Keywords: | pengaduan, kemiripan teks, class based indexing, term frequency inverse document frequency inverse class frequency, k-nearest neighbor, klasifikasi,-complaint, text similarity, class indexing based, term frequency inverse document frequency inverse class frequency, k-nearest neighbor, classification |
Subjects: | 000 Computer science, information and general works > 006 Special computer methods > 006.3 Artificial intelligence > 006.31 Machine learning > 006.312 Data mining |
Divisions: | S2/S3 > Magister Teknik Elektro, Fakultas Teknik |
Depositing User: | Endang Susworini |
Date Deposited: | 06 Jun 2022 07:33 |
Last Modified: | 06 Jun 2022 07:33 |
URI: | http://repository.ub.ac.id/id/eprint/190836 |
Text
SYAHRONI WAHYU IRIANANDA (2).pdf Download (6MB) |
Actions (login required)
View Item |