Pengembangan Aplikasi Information Retrieval untuk Pengklasifikasian Dokumen dengan Menggunakan Metode K-Means Clustering.

Indriati (2008) Pengembangan Aplikasi Information Retrieval untuk Pengklasifikasian Dokumen dengan Menggunakan Metode K-Means Clustering. Sarjana thesis, Universitas Brawijaya.

Abstract

Peningkatan arus informasi yang sangat cepat mendorong berkembangnya teknologi Information Retrieval (IR) yang memberikan hasil dari pencarian berupa dokumen-dokumen yang disusun berdasarkan peringkat kecocokan dengan query yang diinputkan. Sistem Information Retrieval yang memberikan hasil pencarian begitu banyak menyebabkan seorang user mengalami kesulitan sehingga diperlukan pengorganisasian dokumen untuk memperbaiki tingkat relevansi dengan menggunakan teknik dokumen clustering. Algoritma yang digunakan pada teknik dokumen clustering ini adalah metode K-Means Clustering dengan parameter pengukuran berupa nilai similaritas antar dokumen yang diukur menggunakan fungsi cosine. Pada skripsi ini membahas mengenai proses information retrieval meliputi operasi teks, indexing, searching, dan ranking dengan menggunakan basis data teks berupa plain teks serta dilakukan penambahan proses untuk dokumen clustering. Aplikasi perangkat lunak yang dikembangkan memberikan kemudahan pada penggunanya dalam mencari dokumen berupa paper-paper dalam bahasa inggris yang relevan sesuai dengan topik yang diinginkan. User mendapat kemudahan dengan tersedianya pilihan hasil tampilan proses retrieval berdasarkan ranked list (diurutkan berdasarkan kecocokan dengan query untuk semua hasil retrieve) atau ranked cluster (diurutkan berdasarkan kecocokan dengan query untuk hasil retrieve yang berada pada cluster yang sama). Kualitas sistem Information Retrieval didapatkan dengan menguji hasil ranked list retrieval dengan menggunakan benchmark ADI, MED, CRAN dan CISI ditunjukkan dengan kurva Recall-Precision dengan perhitungan interpolated precision pada setiap data benchmark. Setiap data benchmark pada recall bernilai 0 mempunyai nilai precision yaitu ADI bernilai 0.699826413, MED bernilai 0.925321637, CRAN bernilai 0.767748873 dan CISI bernilai 0.561979530. Kualitas dokumen clustering dengan metode K-means clustering didapatkan dengan menguji proses clustering menggunakan jumlah cluster 10 pada data benchmark yang terbagi atas 4 kelas. Pengujian menghasilkan nilai purity 0,935597481 yang mendekati nilai 1 dan menunjukkan bahwa pengelompokkan dokumen ke dalam cluster-cluster tersebut baik karena anggota kelas terkelompok pada cluster yang sama dan sedikit yang terkelompok ke cluster berbeda.

Item Type: Thesis (Sarjana)
Identification Number: SKR/FT/2008/96/050800735
Subjects: 600 Technology (Applied sciences) > 621 Applied physics > 621.3 Electrical, magnetic, optical, communications, computer engineering; electronics, lighting
Divisions: Fakultas Teknik > Teknik Elektro
Depositing User: Endang Susworini
Date Deposited: 12 Mar 2008 09:22
Last Modified: 12 Mar 2008 09:22
URI: http://repository.ub.ac.id/id/eprint/139656
Full text not available from this repository.

Actions (login required)

View Item View Item