Sistem Rekomendasi Tag Pada Dokumen Blog Menggunakan Latent Semantic Indexing

Fadilah,FarisNurul (2012) Sistem Rekomendasi Tag Pada Dokumen Blog Menggunakan Latent Semantic Indexing. Sarjana thesis, Universitas Brawijaya.

Abstract

Pada era Web 2.0 seperti saat ini sebagian besar dokumen web memiliki bentuk berupa blog. Blog merupakan salah satu format dokumen web yang terdiri dari isi, label, dan komentar yang digunakan untuk media interaksi antara pembaca dan penulis isi blog. Selain disajikan secara kronologis, blog juga dapat disajikan berdasarkan komentar terbanyak dan berdasarkan label. Label blog dapat berupa kategori maupun kata kunci. Label kata kunci inilah yang disebut dengan tag . Selain berfungsi sebagai label, tag juga berfungsi sebagai titik temu hasil pencarian dokumen. Berbeda dengan melabelkan dokumen dengan kategori dimana tiap dokumen hanya memiliki satu atau dua kategori, melabelkan dokumen dengan tag membutuhkan waktu lebih banyak karena setiap dokumen memiliki beberapa atau banyak tag . Oleh sebab itu, diterapkan sebuah sistem rekomendasi tag . Sistem rekomendasi tag merupakan sistem yang dapat menghasilkan sejumlah tag secara otomatis dari dokumen yang diinputkan. Pada penelitian ini diterapkan metode Latent Semantic Indexing (LSI) untuk sistem rekomendasi tag . LSI merupakan metode Information Retrieval yang menggunakan pendekatan matematis dalam penerapannya, dalam hal ini yaitu untuk mendapatkan hubungan yang tidak nampak antar kata. Hubungan ini adalah hubungan antara kata kunci yang terdapat pada isi teks dokumen (TI) dan kata kunci yang tidak terdapat pada isi teks dokumen (TO). Ekstraksi TI pada dokumen didapatkan dengan menghitung bobot kata. Dari sejumlah TI yang memiliki bobot tertinggi, didapatkan TO yang muncul bersama sejumlah TI tersebut dari graf data latih. Kemudian dibentuk sebuah matriks yang berisi nilai co-occurrence antara TI dan TO yang telah diperoleh. Matriks tersebut didekomposisi menggunakan Singular Value Decomposition (SVD). Hasil dekomposisi yang merupakan vektor masing-masing TO dihitung kedekatannya dengan vektor query dan diambil jarak yang terdekat. Hasil pengujian menunjukkan nilai recall terbaik dicapai pada saat TI=3 dan TO=6, yaitu 0.69, dimana jumlah rata-rata tag tiap dokumen uji adalah 5 tag . Jadi jika jumlah rata-rata tag pada dokumen uji lebih besar akan lebih besar pula hasil recallnya. Selain dipengaruhi oleh jumlah TI dan TO, nilai akurasi juga dipengaruhi oleh nilai k dimana nilai k adalah besaran untuk mereduksi matriks. Nilai k yang tepat dan menghasilkan akurasi terbaik bergantung pada rank matriks, dimana rank matriks sama dengan jumlah input TI pada sebagian besar kasus. Dari hasil pengujian, nilai k yang menghasilkan F- Measure terbaik untuk rank antara 2 s/d 4 adalah 2.

Item Type: Thesis (Sarjana)
Identification Number: SKR/MIPA/2012/19/051200094
Subjects: 500 Natural sciences and mathematics > 510 Mathematics
Divisions: Fakultas Matematika dan Ilmu Pengetahuan Alam > Matematika
Depositing User: Endang Susworini
Date Deposited: 04 Jul 2012 11:20
Last Modified: 22 Oct 2021 18:48
URI: http://repository.ub.ac.id/id/eprint/153026
[thumbnail of 051200094.pdf]
Preview
Text
051200094.pdf

Download (4MB) | Preview

Actions (login required)

View Item View Item