Deteksi Plagiarisme Pada Artikel Berita Berbahasa Indonesia Menggunakan BM25

Dahniawati, Dina (2019) Deteksi Plagiarisme Pada Artikel Berita Berbahasa Indonesia Menggunakan BM25. Sarjana thesis, Universitas Brawijaya.


Salah satu kasus yang sempat mencoreng dunia jurnalistik yaitu adanya plagiarisme yang pernah dilakukan oleh seorang wartawan terkait dengan artikel berita yang ditulisnya. Pada awalnya tindakan plagiarisme tidak diberikan pengamatan secara ketat, sehingga penggunaan kembali terhadap keseluruhan artikel berita dapat dilakukan secara bebas. Namun seiring dengan berkembangnya waktu, agensi berita tidak lagi mampu mengabaikan kasus plagiarisme, sehingga deteksi plagiarisme menjadi hal yang sangat penting untuk diterapkan. Dalam penelitian ini metode yang digunakan untuk mendeteksi plagiarisme adalah BM25. Proses perhitungan deteksi plagiarisme menggunakan BM25 diawali dengan text preprocessing, pencarian nilai term frequency, inverse document frequency, pembobotan menggunakan BM25, kemudian perhitungan persentase plagiarismenya. Pengujian dilakukan dengan mengubah nilai threshold sebesar 75%, 50%, dan 25%. Kemudian hasil perhitungan plagiarisme menggunakan BM25 akan dibandingkan dengan hasil dari cosine similarity. Hasil rata-rata dari BM25 lebih mendekati threshold dengan selisih sebesar 6,12%, 9,77%, dan 10,01%. Dimana hasil tersebut membuktikan bahwa BM25 bekerja lebih baik daripada cosine similarity yang mempunyai selisih sebesar 14,25%, 26,43%, dan 32,36% dari threshold. Nilai rata-rata precision dari metode BM25 yang diperoleh untuk masing-masing threshold yaitu sebesar 0,87, 0,80, dan 0,63.

English Abstract

One of the cases that had tarnished the world of journalism was the plagiarism that had been carried out by a journalist related to the news articles he wrote. Plagiarism was not given strict observation, so that the reuse of all news articles could be carried out freely in the past. But as time goes by, news agencies are no longer able to ignore the case of plagiarism, so detection of plagiarism is very important to implement. The method used to detect plagiarism in this study is BM25. The process of calculating plagiarism using BM25 begins with text preprocessing, searching for term frequency, inverse document frequency, weighting using BM25, then calculating the percentage of plagiarism. Testing is done by changing the threshold value by 75%, 50%, and 25%. Then the results of plagiarism using BM25 will be compared with the results of cosine similarity. The average results from BM25 are closer to the threshold with a difference of 6.12%, 9.77%, and 10.01%. These results prove that BM25 works better than cosine similarity which has a difference of 14.25%, 26.43% and 32.36% of the threshold. The average value of precision from BM25 for each threshold is 0.87, 0.80, and 0.63.

Item Type: Thesis (Sarjana)
Identification Number: SKR/FILKOM/2019/115/051902285
Uncontrolled Keywords: deteksi plagiarisme, jurnalistik, artikel berita, BM25, cosine similarity-plagiarism detection, journalism, news articles, BM25, cosine similarity
Subjects: 800 Literature (Belles-letters) amd rhetorics > 808 Rhetoric and collections of literary texts from more than two literatures > 808.02 Authorship techniques, plagiarism, editorial techniques > 808.025 Plagiarism
Divisions: Fakultas Ilmu Komputer > Teknik Informatika
Depositing User: soegeng sugeng
Date Deposited: 11 Jun 2020 02:51
Last Modified: 19 Oct 2021 08:59
[thumbnail of Dina Dahniawati.pdf]
Dina Dahniawati.pdf

Download (21MB) | Preview

Actions (login required)

View Item View Item