Klasifikasi Spam Pada Twitter Menggunakan Metode Improved K-Nearest Neighbor

Nathania, Dea Zakia (2018) Klasifikasi Spam Pada Twitter Menggunakan Metode Improved K-Nearest Neighbor. Sarjana thesis, Universitas Brawijaya.

Abstract

Twitter merupakan salah satu layanan aplikasi yang populer karena dapat digunakan untuk berinteraksi dan berkomunikasi dalam kehidupan sehari-hari. Untuk dapat menyebarkan informasi secara cepat maka banyak bermunculan berbagai macam perangkat lunak otomasi. Karena Twitter tidak memeriksa secara ketat mengenai otomasi pada tweet, maka tidak ada pencegahan pemakaian bot secara teratur. Keterbukaan penggunaan layanan otomasi atau automation tweet pada Twitter inilah yang menyebabkan munculnya pasar Spam-as-a-Service yang terdiri dari program pemalsuan, layanan pemendek berbasis iklan dan penjualan akun. Masing-masing layanan ini memungkinkan spammer untuk melakukan proses penyebaran spam dengan menggunakan layanan automation tweet. Sehingga dibutuhkan suatu penelitian untuk melakukan klasifikasi pada tweet untuk mengetahui jenis kategorinya termasuk ke dalam kategori spam atau bukan spam. Proses klasifikasi spam diawali dengan preprocessing yang terdiri dari beberapa tahapan yaitu cleansing, case folding, tokenisasi, filtering dan stemming. Dilanjutkan dengan proses term weghting, hingga proses klasifikasi dengan menggunakan metode Improved K-Nearest Neighbor. Hasil yang diperoleh berdasarkan implementasi dan pengujian penelitian Klasifikasi Spam pada Twitter ini menghasilkan rata-rata Precision sebesar 0.8946, Recall sebesar 0.9405, F-Measure sebesar 0.9155 dan hasil akurasi sebesar 89.57%. Dimana jumlah dokumen, perbandingan atau keseimbangan proporsi data latih dan penentuan nilai k-values yang digunakan berpengaruh terhadap baik atau tidaknya proses klasifikasi terhadap dokumen.

English Abstract

Twitter is a service application that is popular because it can be used to interact and communicate in everyday life. A lot of various new types of automation software increases to disseminate information immediately. Twitter does not strictly check the automation tweet, therefore there is no prevention of the use of bot on a regular basis. Low restriction of the use of automation services on Twitter led to the emergence of market Spam-as-a-Service consisting of counterfeiting program, abridgement ad-based on service and sales account. Each of these services allows spammers to do the spam deployment process by using automation tweet services. So it is necessary to do a research on the classification of the tweet to know the type of category is included in the category of spam or not spam. Spam classification process begins with the preprocessing consists of several stages, namely; cleansing, case folding, tokenization, filtering and stemming. The next step are process of term weighting, until the process of classification using Improved K-Nearest Neighbor method. The results obtained on the basis of implementation and testing research of the classification of Spam on Twitter produces an average Precision of 0.8946, Recall of 0.9405, F-Measure of 0.9155 and results accuracy of 89.57%. Where is the number of documents, a comparison or balance the proportion of training data and the determination of k-values that are used too well or whether the process of classification of the document.

Item Type: Thesis (Sarjana)
Identification Number: SKR/FTIK/2018/148/051801135
Uncontrolled Keywords: Text Mining, Klasifikasi, Spam, Twitter, Improved K-Nearest Neighbor
Subjects: 000 Computer science, information and general works > 001 Knowledge > 001.012 Classification
Divisions: Fakultas Ilmu Komputer > Teknik Informatika
Depositing User: Yusuf Dwi N.
Date Deposited: 30 May 2018 06:28
Last Modified: 26 Oct 2021 08:50
URI: http://repository.ub.ac.id/id/eprint/11237
[thumbnail of BAB I.pdf]
Preview
Text
BAB I.pdf

Download (651kB) | Preview
[thumbnail of BAB VII.pdf]
Preview
Text
BAB VII.pdf

Download (451kB) | Preview
[thumbnail of BAGIAN DEPAN.pdf]
Preview
Text
BAGIAN DEPAN.pdf

Download (1MB) | Preview
[thumbnail of 10. Lampiran.pdf]
Preview
Text
10. Lampiran.pdf

Download (922kB) | Preview
[thumbnail of BAB II.pdf]
Preview
Text
BAB II.pdf

Download (1MB) | Preview
[thumbnail of DAFTAR PUSTAKA.pdf]
Preview
Text
DAFTAR PUSTAKA.pdf

Download (742kB) | Preview
[thumbnail of BAB III.pdf]
Preview
Text
BAB III.pdf

Download (670kB) | Preview
[thumbnail of BAB V.pdf] Text
BAB V.pdf

Download (1MB)
[thumbnail of BAB IV.pdf] Text
BAB IV.pdf

Download (1MB)
[thumbnail of BAB VI.pdf]
Preview
Text
BAB VI.pdf

Download (733kB) | Preview

Actions (login required)

View Item View Item