Agusvina, Novia (2018) Pengelompokan Artikel Berbahasa Indonesia Dengan Menggunakan Reduksi Fitur Information Gain Thresholding Dan K-Means. Sarjana thesis, Universitas Brawijaya.
Abstract
Artikel online merupakan sumber informasi yang banyak tersebar di situs internet. Semakin banyaknya artikel yang tersebar di situs internet, menyulitkan pengguna dalam menemukan artikel yang diinginkan. Salah satu penyedia layanan artikel online adalah Kompas.com. Untuk menghadapi persaingan antar industri media massa, langkah yang dilakukan Kompas.com adalah memberikan fitur yang memudahkan pengguna, seperti fitur rekomendasi artikel terkait. Namun, dalam penerapannya Kompas.com masih kurang maksimal sehingga tetap kalah dengan media massa online lainnya. Pada penelitian ini, peneliti mengimplementasikan metode reduksi fitur Information Gain Thresholding dan K-Means untuk membuat kelompok artikel terkait. Tujuan dari penelitian ini adalah untuk memperbaiki sistem artikel terkait dari Kompas.com. Data yang digunakan dalam penelitian ini adalah artikel dari Kompas.com dari kategori Lifestyle. Dalam pengimplementasian digunakan bahasa java. Pada tahap awal dilakukan preprocessing untuk mengurangi gangguan dalam data, selanjutnya dilakukan reduksi fitur untuk mengurangi fitur yang digunakan agar proses kebih cepat, kemudian dilakukan pembobotan sebagai dasar untuk menghitung jarak antar dokumen, setelah menemukan nilai jarak awal atau centroid , pengelompokan dapat dilakukan. Hasil menunjukan bahwa pengelompokan artikel dengan metode Information Gain Thresholding dan K-Means mampu menghasilkan kelompok dokumen yang baik dengan nilai silhouette coeffiecient sebesar 0.9595 dan purity measure sebesar 0.75 dengan penggunaan 3 cluster dan batas ambang untuk reduksi fitur terbaik adalah 0.04 dengan waktu eksekusi lebih cepat sebanyak 103 menit dibandingkan tanpa reduksi fitur.
English Abstract
Online articles are a source of information that is widely spread on the internet site. The increasing number of articles on the website makes an activity to find the desired article difficult for the user. A simple example of this online article service provider is Kompas.com. Since competition among mass media industry is getting more difficult, Kompas.com needs to find a way to keep up, one of the ways is by giving a “recommended articles related” feature. However, in its application Kompas.com still less than the maximum so it remains inferior to other online mass media. In this study, researcher implemented two methods called “Information Gain Threshold” and “K-Means” to create a group of related articles and to improve the searching activity in Kompas.com. The data used in this research is an article taken from Kompas.com in “Lifestyle” category. In the implementation, the programming language used is Java and as for the early stages of preprocessing, to reduce the disturbance in the data, feature reduction is used to give faster processing of the data. Then, it is weighted to do the basic calculation of the distance between documents. Afterward, making the data into group can be done. The results show that the clustering of articles using Information Gain Threshold and K-Means is good enough, has criteria of silhouette coefficient of 0.9595 and a purity measure of 0.75 with 3 clusters and 0.04 threshold limit, this conclude that it gives faster execution time in 103 minutes of time compared to without feature reduction.
Item Type: | Thesis (Sarjana) |
---|---|
Identification Number: | SKR/FTIK/2018/160/051801147 |
Uncontrolled Keywords: | Artikel Online, Reduksi Fitur, Information Gain Thresholding, Pengelompokan, K-Mean |
Subjects: | 000 Computer science, information and general works > 005 Computer programming, programs, data |
Divisions: | Fakultas Ilmu Komputer > Teknik Informatika |
Depositing User: | Yusuf Dwi N. |
Date Deposited: | 26 Jun 2018 07:07 |
Last Modified: | 26 Oct 2021 08:56 |
URI: | http://repository.ub.ac.id/id/eprint/11631 |
Preview |
Text
Bagian Depan.pdf Download (1MB) | Preview |
Preview |
Text
Daftar Pustaka.pdf Download (290kB) | Preview |
Preview |
Text
BAB I.pdf Download (284kB) | Preview |
Preview |
Text
Lampiran.pdf Download (501kB) | Preview |
Preview |
Text
BAB III.pdf Download (326kB) | Preview |
Preview |
Text
BAB II.pdf Download (2MB) | Preview |
Preview |
Text
BAB IV.pdf Download (713kB) | Preview |
Preview |
Text
BAB VI.pdf Download (397kB) | Preview |
Preview |
Text
BAB VII.pdf Download (290kB) | Preview |
Preview |
Text
BAB V.pdf Download (514kB) | Preview |
Actions (login required)
View Item |