Pengelompokan Artikel Berbahasa Indonesia Dengan Menggunakan Reduksi Fitur Information Gain Thresholding Dan K-Means

Agusvina, Novia (2018) Pengelompokan Artikel Berbahasa Indonesia Dengan Menggunakan Reduksi Fitur Information Gain Thresholding Dan K-Means. Sarjana thesis, Universitas Brawijaya.

Abstract

Artikel online merupakan sumber informasi yang banyak tersebar di situs internet. Semakin banyaknya artikel yang tersebar di situs internet, menyulitkan pengguna dalam menemukan artikel yang diinginkan. Salah satu penyedia layanan artikel online adalah Kompas.com. Untuk menghadapi persaingan antar industri media massa, langkah yang dilakukan Kompas.com adalah memberikan fitur yang memudahkan pengguna, seperti fitur rekomendasi artikel terkait. Namun, dalam penerapannya Kompas.com masih kurang maksimal sehingga tetap kalah dengan media massa online lainnya. Pada penelitian ini, peneliti mengimplementasikan metode reduksi fitur Information Gain Thresholding dan K-Means untuk membuat kelompok artikel terkait. Tujuan dari penelitian ini adalah untuk memperbaiki sistem artikel terkait dari Kompas.com. Data yang digunakan dalam penelitian ini adalah artikel dari Kompas.com dari kategori Lifestyle. Dalam pengimplementasian digunakan bahasa java. Pada tahap awal dilakukan preprocessing untuk mengurangi gangguan dalam data, selanjutnya dilakukan reduksi fitur untuk mengurangi fitur yang digunakan agar proses kebih cepat, kemudian dilakukan pembobotan sebagai dasar untuk menghitung jarak antar dokumen, setelah menemukan nilai jarak awal atau centroid , pengelompokan dapat dilakukan. Hasil menunjukan bahwa pengelompokan artikel dengan metode Information Gain Thresholding dan K-Means mampu menghasilkan kelompok dokumen yang baik dengan nilai silhouette coeffiecient sebesar 0.9595 dan purity measure sebesar 0.75 dengan penggunaan 3 cluster dan batas ambang untuk reduksi fitur terbaik adalah 0.04 dengan waktu eksekusi lebih cepat sebanyak 103 menit dibandingkan tanpa reduksi fitur.

English Abstract

Online articles are a source of information that is widely spread on the internet site. The increasing number of articles on the website makes an activity to find the desired article difficult for the user. A simple example of this online article service provider is Kompas.com. Since competition among mass media industry is getting more difficult, Kompas.com needs to find a way to keep up, one of the ways is by giving a “recommended articles related” feature. However, in its application Kompas.com still less than the maximum so it remains inferior to other online mass media. In this study, researcher implemented two methods called “Information Gain Threshold” and “K-Means” to create a group of related articles and to improve the searching activity in Kompas.com. The data used in this research is an article taken from Kompas.com in “Lifestyle” category. In the implementation, the programming language used is Java and as for the early stages of preprocessing, to reduce the disturbance in the data, feature reduction is used to give faster processing of the data. Then, it is weighted to do the basic calculation of the distance between documents. Afterward, making the data into group can be done. The results show that the clustering of articles using Information Gain Threshold and K-Means is good enough, has criteria of silhouette coefficient of 0.9595 and a purity measure of 0.75 with 3 clusters and 0.04 threshold limit, this conclude that it gives faster execution time in 103 minutes of time compared to without feature reduction.

Item Type: Thesis (Sarjana)
Identification Number: SKR/FTIK/2018/160/051801147
Uncontrolled Keywords: Artikel Online, Reduksi Fitur, Information Gain Thresholding, Pengelompokan, K-Mean
Subjects: 000 Computer science, information and general works > 005 Computer programming, programs, data
Divisions: Fakultas Ilmu Komputer > Teknik Informatika
Depositing User: Yusuf Dwi N.
Date Deposited: 26 Jun 2018 07:07
Last Modified: 26 Oct 2021 08:56
URI: http://repository.ub.ac.id/id/eprint/11631
[thumbnail of Bagian Depan.pdf]
Preview
Text
Bagian Depan.pdf

Download (1MB) | Preview
[thumbnail of Daftar Pustaka.pdf]
Preview
Text
Daftar Pustaka.pdf

Download (290kB) | Preview
[thumbnail of BAB I.pdf]
Preview
Text
BAB I.pdf

Download (284kB) | Preview
[thumbnail of Lampiran.pdf]
Preview
Text
Lampiran.pdf

Download (501kB) | Preview
[thumbnail of BAB III.pdf]
Preview
Text
BAB III.pdf

Download (326kB) | Preview
[thumbnail of BAB II.pdf]
Preview
Text
BAB II.pdf

Download (2MB) | Preview
[thumbnail of BAB IV.pdf]
Preview
Text
BAB IV.pdf

Download (713kB) | Preview
[thumbnail of BAB VI.pdf]
Preview
Text
BAB VI.pdf

Download (397kB) | Preview
[thumbnail of BAB VII.pdf]
Preview
Text
BAB VII.pdf

Download (290kB) | Preview
[thumbnail of BAB V.pdf]
Preview
Text
BAB V.pdf

Download (514kB) | Preview

Actions (login required)

View Item View Item