Klasifikasi Dokumen Teks Menggunakan Metode Improved K-Nearest Neighbor (Knn) Berdasarkan Emosi Yang Tersirat Pada Teks

Hamid,MAchyar (2012) Klasifikasi Dokumen Teks Menggunakan Metode Improved K-Nearest Neighbor (Knn) Berdasarkan Emosi Yang Tersirat Pada Teks. Sarjana thesis, Universitas Brawijaya.

Abstract

Klasifikasi dokumen teks berdasar emosi ini digunakan untuk mengklasifikasikan dokumen teks berdasarkan kata-kata emosi yang tersirat didalamnya. Dari masing-masing kata tidak diperhatikan hubungan antar katanya. Proses diawali dengan preprocessing kemudian dibentuk inverted index. Pembobotan menggunakan TF-IDF dan pencarian kemiripan digunakan cosine similarity. Proses klasifikasi menggunakan metode improved K-Nearest Neighbor (KNN). Penelitian ini menggunakan data latih sebanyak 200 kalimat untuk masing-masing emosi, emosi tersebut antara lain marah, sedih, takut, jijik, malu, senang dan bersalah. Data uji menggunakan 70 kalimat yang telah diberikan label emosi. Nilai k digunakan rentang dari 1 sampai dengan 70. Sistem akan menentukan relevansi berdasarkan kecocokan tabel antara data latih dan data uji. Sistem bekerja menghasilkan tingkat akurasi sebesar 0.5-0.7 dengan menggunakan fmeasure sebagai parameter evaluasi . Nilai fmeasure terbesar dihasilkan pada k= 13 yaitu sebesar 0.7. Dari nilai fmeasure yang dihasilkan sistem belum bekerja dengan baik karena masih belum mendekati nilai 1 yang merupakan nilai maksimal dari akurasi sistem temu kembali.

Item Type: Thesis (Sarjana)
Identification Number: SKR/MIPA/2012/12/051200087
Subjects: 500 Natural sciences and mathematics > 510 Mathematics
Divisions: Fakultas Matematika dan Ilmu Pengetahuan Alam > Matematika
Depositing User: Endang Susworini
Date Deposited: 06 Jul 2012 10:38
Last Modified: 22 Oct 2021 16:59
URI: http://repository.ub.ac.id/id/eprint/152954
[thumbnail of 051200087.pdf]
Preview
Text
051200087.pdf

Download (3MB) | Preview

Actions (login required)

View Item View Item