Klasifikasi Berita Berbahasa Indonesia Dengan Pengklasifikasi SVM (Support Vector Machine)

AgungHardianto (2011) Klasifikasi Berita Berbahasa Indonesia Dengan Pengklasifikasi SVM (Support Vector Machine). Sarjana thesis, Universitas Brawijaya.

Abstract

Berita merupakan suatu hal yang penting bagi masyarakat dan tidak bisa dipisahkan dari masyarakat. Oleh karena itu kebutuhan akan proses pengklasifikasian berita kedalam kategori tertentu diperlukan untuk memperoleh informasi yang relevan dan cepat. Penelitian akan memperlihatkan sebuah sistem pengklasifikasian berita dengan Support Vector Machine (SVM), dimana dokumen yang digunakan berasal dari situs media surat kabar Kompas. Pada penelitian ada dua tahap yaitu preprocessing dan pengklasifikasian. Tahapan dari preprocessing yaitu tokenizing, stopword, stemming, menghitung kata, menghitung frekuensi kata lebih dari tiga, menghitung TF-IDF dan penormalan. Tahap pengklasifikasian menggunakan SVM. SVM merupakan salah satu metode pengklasifikasian yang cukup handal untuk digunakan dalam pengklasifikasian berita. Inti pemrosesan SVM berada pada pembentukan OSH (Optimum Separating Hyperplane) yang mengklasifikasikan kelas biner. Pada permasalahan multiclass digunakan salah satu mekanisme penggabungan klasifikasi biner yaitu one against one. Hasil dari penelitian ini didapatkan tingkat akurasi sekitar 85.00%. Dengan tingkat akurasi ini maka metode SVM cukup handal untuk diimplementasikan pada sistem klasifikasi berita berbahasa Indonesia.

English Abstract

News is an important thing for the community and can‟t be separated from society. Therefore, the need of news classification process into specific categories is necessary to obtain information relevant and quick. Research will show a news system with classification of Support Vector Machine (SVM), where the used document comes from news paper sites Kompas. At research there are two stages, preprocessing and classification. Namely preprocessing is tokenizing, stopword, stemming, word count, word frequency count for more than three, calculate TF-IDF and more like this. Stage classification using SVM. SVM is one of classification method is reliable for use in the classification in news. The nucleus of SVM process is in the formation OSH (Optimum Separating Hyperplane) which classify binary classes. In multiclass problems used in one of the mechanisms merging binary classifications of one against one. The results of this research is approxmately 85.00% accuracy rate. With this accuracy the SVM method reliable for the classification system implemented in Indonesian news.

Item Type: Thesis (Sarjana)
Identification Number: SKR/MIPA/2011/38/051100422
Subjects: 500 Natural sciences and mathematics > 510 Mathematics
Divisions: Fakultas Matematika dan Ilmu Pengetahuan Alam > Matematika
Depositing User: Unnamed user with email repository.ub@ub.ac.id
Date Deposited: 23 Feb 2011 08:44
Last Modified: 22 Oct 2021 08:57
URI: http://repository.ub.ac.id/id/eprint/152847
[thumbnail of 051100422.pdf]
Preview
Text
051100422.pdf

Download (4MB) | Preview

Actions (login required)

View Item View Item