Penerapan Neighbor-Weighted K-Nearest Neighbor Untuk Klasifikasi Corpus Teks Berbahasa Indonesia Yang Tidak Seimbang

Latifah,Retnani (2012) Penerapan Neighbor-Weighted K-Nearest Neighbor Untuk Klasifikasi Corpus Teks Berbahasa Indonesia Yang Tidak Seimbang. Sarjana thesis, Universitas Brawijaya.

Abstract

Penelitian ini membahas mengenai penerapan algoritma Neighbor Weighted K-Nearest Neighbor (NWKNN) untuk mengklasifikasikan dokumen teks berbahasa Indonesia dengan corpus (kumpulan dokumen) yang tidak seimbang. Algoritma ini memberikan bobot yang kecil untuk tetangga – tetangga yang berasal dari kategori yang besar dan memberikan bobot yang besar pada tetangga – tetangga yang berasal dari kategori yang kecil. Dokumen yang digunakan sebanyak 785 dokumen dari 8 kategori. Pengujian algoritma NWKNN dengan rasio dokumen latih 75% dan dokumen uji 25% serta exponent = 2 dan threshold document frequency = 5 menghasilkan nilai rata - rata precision, recall dan F1 measure sebesar 84.2%, 86.7% dan 84.3%. Sedangkan algoritma KNN menghasilkan nilai rata - rata precision, recall dan F1 measure sebesar 84.6%, 79.8% dan 81.7% dengan nilai parameter yang sama. Nilai recall dan F1 measure NWKNN lebih besar 6.9% dan 2.6% daripada KNN. Penelitian ini menunjukkan bahwa algoritma NWKNN memiliki kinerja yang lebih baik dalam mengklasifikasikan corpus teks berbahasa Indonesia yang tidak seimbang.

Item Type: Thesis (Sarjana)
Identification Number: SKR/MIPA/2012/138/051201655
Subjects: 500 Natural sciences and mathematics > 510 Mathematics
Divisions: Fakultas Matematika dan Ilmu Pengetahuan Alam > Matematika
Depositing User: Endang Susworini
Date Deposited: 04 Jul 2012 10:53
Last Modified: 22 Oct 2021 17:25
URI: http://repository.ub.ac.id/id/eprint/152974
[thumbnail of 051201655.pdf]
Preview
Text
051201655.pdf

Download (6MB) | Preview

Actions (login required)

View Item View Item