Klasifikasi dokumen berita berbahasa Indonesia dengan algoritma Agglomerative Single Linkage Hierarchical Clustering

IftichaDinaPratiwi (2010) Klasifikasi dokumen berita berbahasa Indonesia dengan algoritma Agglomerative Single Linkage Hierarchical Clustering. Sarjana thesis, Universitas Brawijaya.

Abstract

Berita sudah menjadi kebutuhan masyarakat Indonesia sehari –hari. Berita yang disajikan dalam bentuk media online berupa dokumen yang jumlahnya sangat banyak dan sulit sekali jika dokumen – dokumen berita tersebut diklasifikasikan secara manual, sehingga dibutuhkan sistem pengklasifikasian berita secara otomatis, untuk mempermudah pencarian berita mengenai suatu kejadian tertentu. Sistem pengklasifikasian berita merupakan penerapan dari text mining yang berusaha mengelompokkan secara otomatis suatu berita ke dalam suatu kategori tertentu. Text mining merupakan varian data mining yang berusaha untuk mengekstraksi dan menemukan informasi yang belum diketahui sebelumnya dari sekumpulan data tekstual yang besar jumlahnya. Tahapan – tahapan yang dilakukan dalam sistem adalah, pertama dilakukan proses case folding yaitu merubah semua huruf menjadi huruf kecil, tahap kedua yaitu penguraian kata (parsing), tahap ketiga yaitu mengubah kata-kata ke dalam bentuk dasarnya (stemming), tahap keempat yaitu penghilangan stopword (kata-kata yang bukan merupakan ciri dari suatu dokumen) dan yang terakhir yaitu tahapan terpenting yang berusaha menemukan pola atau pengetahuan dari keseluruhan teks, yang dalam penelitian ini menggunakan algoritma Aglomerative Single Lingkage Hirarchical Clustering. Untuk mengevaluasi efektifitas sistem klasifikasi, digunakan standar pengukuran recall, precision dan F1-measure. Hasil uji coba menunjukkan nilai recall, precision, dan F1 measure yang rendah, sehingga dapat disimpulkan metode yang diterapkan pada pembuatan sistem ini tidak cocok digunakan untuk mengklasifikasikan dokumen berita berbahasa Indonesia.

Item Type: Thesis (Sarjana)
Identification Number: SKR/MIPA/2010/75/051001057
Subjects: 500 Natural sciences and mathematics > 510 Mathematics
Divisions: Fakultas Matematika dan Ilmu Pengetahuan Alam > Matematika
Depositing User: Unnamed user with email repository.ub@ub.ac.id
Date Deposited: 16 Apr 2010 14:52
Last Modified: 22 Oct 2021 07:04
URI: http://repository.ub.ac.id/id/eprint/152535
[thumbnail of 051001057.pdf]
Preview
Text
051001057.pdf

Download (2MB) | Preview

Actions (login required)

View Item View Item