Klasifikasi Berita Olahraga Berbahasa Indonesia Menggunakan Metode BM25 dan K-Nearest Neighbor

Septrinas, Enggar (2020) Klasifikasi Berita Olahraga Berbahasa Indonesia Menggunakan Metode BM25 dan K-Nearest Neighbor. Sarjana thesis, Universitas Brawijaya.

Abstract

Antara Sumbar merupakan sebuah portal berita yang bertujuan untuk memenuhi hak publik untuk mendapatkan informasi yang akurat dan lengkap secara seketika. Terdapat berbagai macam berita yang disajikan, salah satunya adalah berita olahraga. Dengan perkembangan informasi digital yang terus meningkat menyebabkan begitu cepatnya penyebaran dokumen berita sehingga dibutuhkan portal web yang dikelola secara profesional. Antara Sumbar merupakan portal berita yang telah dikelola secara profesional, namun ada beberapa kekurangan terhadap pengelompokkan berita olahraga, yang menyebabkan terganggunya pembaca dalam mendapatkan berita berdasarkan kategori olahraga yang ada. Kekurangan tersebut dapat diatasi menggunakan metode BM25 dan K-Nearest Neighbor. Proses yang dilakukan untuk mengatasi kekurangan tersebut adalah melakukan preprocessing terhadap dokumen berita, melakukan pembobotan dan pemeringkatan menggunakan metode BM25, dan yang terakhir proses algoritme K-Nearest Neighbor sebagai metode klasifikasi. Proses pengujian yang digunakan adalah metode k-fold sebanyak 7 kali pengujian. Data yang digunakan pada tiap-tiap pengujian yaitu sebanyak 240 dokumen latih dan 40 dokumen uji. Berdasarkan pengujian yang dilakukan, didapatkan hasil pengujian tertinggi ketika nilai ketetanggaan (k) sebesar 20, menghasilkan nilai precision = 0,921577, nilai recall = 0,914286 dan nilai f-measure = 0,917917. Proses klasifikasi dipengaruhi oleh jumlah dokumen yang digunakan serta besaran nilai k yang ditentukan.

English Abstract

Antara sumbar is a news portal aims to meet the public’s right to get accurate information and complete information instantly. There are various kind of news presented, one of them is sports news. Digital information that keeps developmental improvement causing the news spread quickly, so it takes a web portal mainly managed professionally. Antara Sumbar was a news portal who was professionally managed to be, but there are some flaws, the flaws are in the extraction of sport news. Its causing the reader difficult to find some news based on the news category. The problem can be handled using BM25 and K-Nearest Neighbor methods. The process was done to solve the problem is doing preprocessing document news, calculate the BM25 score of each document news, and the last one is doing classification process using the K-Nearest Neighbor method. The testing process used is 7 k-fold method. Data used on every test is 240 training documents and 40 testing document. Based on testing it’s done, got the best test results in k’s value is 20, with precision value = 0,921577, recall value = 0,914286, and f-measure value = 0,917917. The process of classification is affected by the amount of document used and the value of k

Other obstract

-

Item Type: Thesis (Sarjana)
Identification Number: SKR/FILKOM/2020/37/052002999
Uncontrolled Keywords: berita olahraga, text mining ,klasifikasi, BM25, k-nearest neighbor, sport news, text mining, classification, BM25, k-nearest neighbor
Subjects: 000 Computer science, information and general works > 001 Knowledge > 001.012 Classification
Divisions: Fakultas Ilmu Komputer > Teknik Informatika
Depositing User: Budi Wahyono Wahyono
Date Deposited: 05 Aug 2020 08:14
Last Modified: 13 Apr 2023 06:21
URI: http://repository.ub.ac.id/id/eprint/180505
[thumbnail of DALAM MASA EMBARGO] Text (DALAM MASA EMBARGO)
Enggar Septrinas.pdf - Published Version
Restricted to Registered users only until 31 December 2023.

Download (8MB)

Actions (login required)

View Item View Item