Klasifikasi Berita Online Dengan Menggunakan Pembobotan TF-IDF Dan Cosine Similarity

Herwijayanti, Bening (2017) Klasifikasi Berita Online Dengan Menggunakan Pembobotan TF-IDF Dan Cosine Similarity. Sarjana thesis, Universitas Brawijaya.

Abstract

Dalam klasifikasi berita online dengan menggunakan pembobotan tf-idf dan cosine similarity ini mendapatkan referensi penelitian sebelumnya mengenai klasifikasi berita online menggunakan algoritma single pass clustering, dimana data yang akan digunakan berasal dari website berita online yaitu kompas.com. Karena banyaknya berita yang dimasukkan ke dalam website, sehingga terkadang berita tersebut terposting tidak sesuai dengan kategorinya. Human error akan menjadi masalah berita yang salah posting. Selain kesalahan posting pengelompokan berita online juga penting untuk kenyamanan user untuk mencari berita sesuai dengan kategorinya. Menerapkan klasifikasi berita online dengan menggunakan tf-idf dan cosine similarity, memerlukan proses preprocessing yaitu tokenizing, stopword dan stemming dapat memperkecil term sehingga mempercepat proses perhitungan pembobotan term menggunakan tf-idf dan mempercepat proses cosine similarity. Tujuannya adalah untuk mempermudahkan human error serta mengurangi terjadinya kesalahan pengkategorian. klasifikasi mampu mengelompokkan berita dengan tingkat akurasi sebesar 91.25%.

English Abstract

In discussing the online news by using the weighting of tf-idf and cosine of this similarity the previous research reference on online news information using single pass clustering algorithm, where the data to be used comes from the online news website that is kompas.com. Because of the many news that is on the website, so sometimes the news is posted not in accordance with the category. Human error will be the problem of wrong news posting. In addition to posting errors online news groupings are also important for the convenience of users to search for news according to their category. Implementing online news stories using tf-idf and cosine similarities, preprocessing processes ie tokenizing, stopword and stemming can reduce the term process of speeding the weighting of terms using tf-idf and accelerating the cosine process of similarity. The goal is to facilitate human error as well as reduce caution categorization. The value is able to classify news with accreditation rate of 91.25%.

Item Type: Thesis (Sarjana)
Identification Number: SKR/FTIK/2017/394/051706741
Uncontrolled Keywords: Klasifikasi Berita Online, TF-IDF, Cosine Similarity
Subjects: 000 Computer science, information and general works > 001 Knowledge > 001.012 Classification
Divisions: Fakultas Ilmu Komputer > Teknik Informatika
Depositing User: Yusuf Dwi N.
Date Deposited: 23 Aug 2017 03:30
Last Modified: 15 Sep 2020 03:01
URI: http://repository.ub.ac.id/id/eprint/1566
[thumbnail of Bening Herwijayanti.pdf]
Preview
Text
Bening Herwijayanti.pdf

Download (5MB) | Preview

Actions (login required)

View Item View Item