ErninNiswatulUkhwah (2007) Pengklasifikasian E-Book berdasarkan Table of Content menurut Dewey Decimal Classification menggunakan Algoritma K-Nearest Neighbor. Sarjana thesis, Universitas Brawijaya.
Abstract
Pengklasifikasian e-book adalah salah satu implementasi pengkategorian teks yang merupakan bidang khusus dari text mining. Klasifikasi ini biasanya dilakukan secara manual oleh pustakawan berdasarkan aturan Dewey Decimal Classification (DDC) terhadap bahan pustaka. Hal ini mengharuskan seorang pustakawan mengerti aturan DDC dan berbagai subjek bahan pustaka, sedangkan jumlah e-book sebagai salah satu sumber bahan pustaka semakin meningkat. Proses klasifikasi ini dapat dilakukan secara otomatis dengan memanfaatkan algoritma k-nearest neighbor yang bertujuan untuk megklasifikasikan e-book kedalam kategori tertentu berdasarkan aturan DDC. Informasi yang digunakan berasal dari table of content sebuah e-book seperti yang dilakukan oleh pustakawan ketika melakukan klasifikasi secara manual. Proses yang dilakukan untuk menghasilkan sebuah sistem pengkategori meliputi beberapa tahap, yaitu penghapusan markup dan format, tokenization, filtration, stemming, pembobotan dan pembentukan classifier. Tahap pembentukan classsifier merupakan tahap terpenting karena classifier inilah yang akan digunakan untuk mengklasifikasikan suatu dokumen baru. Pada tahap ini algoritma k-nearest neighbor dimanfaatkan untuk melakukan klasifikasi dengan cara mencari dokumen yang paling mirip dengan dokumen baru. Kemiripan dapat diperoleh melalui perhitungan jarak menggunakan cosine similarity. Hasil perhitungan ini diurutkan secara menurun. Nilai kemiripan yang paling tinggi sebanyak k akan digunakan untuk menentukan kategori dokumen baru. dimana dalam penelitian ini nilai k yang digunakan adalah satu dan lima. Evaluasi terhadap sistem pengkategori e-book ini digunakan perhitungan recall, precision, dan F-measure yang merupakan gabungan dari recall dan precision. Hasil evaluasi menunjukkan nilai rata-rata F measure sebesar 0.659(66%) untuk k=1 dan rata-rata F measure sebesar 0.701(70%) untuk k=5.
Item Type: | Thesis (Sarjana) |
---|---|
Identification Number: | SKR/MIPA/2007/050702214 |
Subjects: | 500 Natural sciences and mathematics > 510 Mathematics |
Divisions: | Fakultas Matematika dan Ilmu Pengetahuan Alam > Matematika |
Depositing User: | Unnamed user with email repository.ub@ub.ac.id |
Date Deposited: | 29 Aug 2007 00:00 |
Last Modified: | 22 Oct 2021 03:31 |
URI: | http://repository.ub.ac.id/id/eprint/151647 |
Preview |
Text
050702214.pdf Download (4MB) | Preview |
Actions (login required)
View Item |