Latifah,Retnani (2012) Penerapan Neighbor-Weighted K-Nearest Neighbor Untuk Klasifikasi Corpus Teks Berbahasa Indonesia Yang Tidak Seimbang. Sarjana thesis, Universitas Brawijaya.
Abstract
Penelitian ini membahas mengenai penerapan algoritma Neighbor Weighted K-Nearest Neighbor (NWKNN) untuk mengklasifikasikan dokumen teks berbahasa Indonesia dengan corpus (kumpulan dokumen) yang tidak seimbang. Algoritma ini memberikan bobot yang kecil untuk tetangga – tetangga yang berasal dari kategori yang besar dan memberikan bobot yang besar pada tetangga – tetangga yang berasal dari kategori yang kecil. Dokumen yang digunakan sebanyak 785 dokumen dari 8 kategori. Pengujian algoritma NWKNN dengan rasio dokumen latih 75% dan dokumen uji 25% serta exponent = 2 dan threshold document frequency = 5 menghasilkan nilai rata - rata precision, recall dan F1 measure sebesar 84.2%, 86.7% dan 84.3%. Sedangkan algoritma KNN menghasilkan nilai rata - rata precision, recall dan F1 measure sebesar 84.6%, 79.8% dan 81.7% dengan nilai parameter yang sama. Nilai recall dan F1 measure NWKNN lebih besar 6.9% dan 2.6% daripada KNN. Penelitian ini menunjukkan bahwa algoritma NWKNN memiliki kinerja yang lebih baik dalam mengklasifikasikan corpus teks berbahasa Indonesia yang tidak seimbang.
Item Type: | Thesis (Sarjana) |
---|---|
Identification Number: | SKR/MIPA/2012/138/051201655 |
Subjects: | 500 Natural sciences and mathematics > 510 Mathematics |
Divisions: | Fakultas Matematika dan Ilmu Pengetahuan Alam > Matematika |
Depositing User: | Endang Susworini |
Date Deposited: | 04 Jul 2012 10:53 |
Last Modified: | 22 Oct 2021 17:25 |
URI: | http://repository.ub.ac.id/id/eprint/152974 |
Preview |
Text
051201655.pdf Download (6MB) | Preview |
Actions (login required)
View Item |