Deteksi Plagiarisme pada Dokumen Teks Bahasa Indonesia menggunakan Algoritma Winnowing dengan Stemming.

Winangga, Milani (2014) Deteksi Plagiarisme pada Dokumen Teks Bahasa Indonesia menggunakan Algoritma Winnowing dengan Stemming. Sarjana thesis, Universitas Brawijaya.

Abstract

Perkembangan teknologi saat ini, memperbesar peluang seseorang untuk melakukan tindakan plagiarisme. Data digital sangat mudah untuk dijiplak, terutama dokumen digital. Kasus ini sering terjadi di kalangan mahasiswa dalam pengerjaan tugas. Namun demikian jarang ditemukan penjiplakan seluruh isi dokumen, terkadang mahasiswa hanya mengambil sebagian data, kemudian memodifikasinya dengan perubahan posisi kalimat atau penghilangan beberapa kata, sehingga sulit dalam mendeteksinya. Untuk memperkecil tindakan penjiplakan, diperlukan suatu sistem yang mampu mendeteksi penjiplakan tanpa mengabaikan perubahan posisi kalimat, pemotongan kata ataupun perubahan kata aktif menjadi kata pasif atau sebaliknya. Penelitian ini membuat sistem deteksi plagiarisme pada dokumen teks bahasa Indonesia menggunakan algoritma Winnowing dengan stemming. Algoritma winnowing akan mencari fingerprint dari tiap dokumen yang akan dibandingkan. Pada preprocessing terdapat penambahan stemming yang bertujuan untuk menghilangkan imbuhan kata. Similarity antar dokumen didasarkan pada kecocokan substring antar fingerprint, yang akan di hitung menggunakan prinsip Jaccard Coefficient. Nilai 5 untuk k-gram, nilai 25 untuk threshold dan 11 untuk basis sebagai hasil dari pengujian nilai parameter akan digunakan pada pengujian similarity, waktu eksekusi, dan error terhadap sistem dengan stemming dan tanpa stemming. Hasil pengujian menunjukkan bahwa sistem dengan stemming cenderung menghasilkan prosentase similarity yang kurang baik dibandingkan dengan sistem tanpa stemming. Lama waktu eksekusi pada pengujian sistem dengan stemming dan tanpa stemming tidak jauh berbeda. Sistem dengan stemming cenderung membutuhkan waktu lebih lama dibandingkan dengan sistem tanpa stemming. Pada pengujian error, terlihat bahwa sistem dengan stemming menghasilkan prosentase error yang lebih tinggi dibandingkan sistem tanpa stemming.

English Abstract

Nowadays, the development of technology increases the opportunity of people to perform plagiarism. Digital data is very easy to be duplicated, especially digital documents. This case has happened between students in performing their tasks. But rarely found plagiarized entire document, sometimes students just take a portion of data, and then change the position of the sentence or remove a few words, that’s making it difficult to detect. To minimize plagiarism, we need a system that can detect plagiarism without ignoring changes the position of the sentences, cutting words or change the active word to passive or passive to active. This study makes plagiarism detection on Indonesian text document using Winnowing algorithm with stemming. Winnowing algorithm will look for the fingerprint of each document to be compared. In the preprocessing, we will add stemming which eliminate the affixes of the words. Similarity between documents based on a substring match between the fingerprints which will be calculated using the principle of Jaccard Coefficient. The value of 5 for k-grams, 25 for threshold, and 11 for the basis as a result on the testing before are being used in the similarity testing, execution time testing, and the error testing on system with stemming and without stemming. The results show that the system with stemming tends to produce a percentage of similarity which not better than the system without stemming. The execution time on system with and without stemming is not much different. Systems with stemming take a longer time than the system without stemming. In error testing, it appears that the system with stemming produce higher percentage than the system without stemming.

Item Type: Thesis (Sarjana)
Identification Number: SKR/FTIK/2014/97/051403557
Subjects: 000 Computer science, information and general works > 005 Computer programming, programs, data
Divisions: Fakultas Ilmu Komputer > Teknik Informatika
Depositing User: Budi Wahyono Wahyono
Date Deposited: 03 Jul 2014 09:56
Last Modified: 20 Oct 2021 06:53
URI: http://repository.ub.ac.id/id/eprint/146130
[thumbnail of Laporan_skripsi-0910680026.pdf]
Preview
Text
Laporan_skripsi-0910680026.pdf

Download (3MB) | Preview

Actions (login required)

View Item View Item