Klasifikasi Spam Pada Short Message Service (SMS) menggunakan Support Vector Machine

Panjaitan, Mutiharis Dauber and Pandu Adikara, S.Kom., M.Kom. and Dr. Eng. Budi Darma Setiawan, S.Kom., M.Cs. (2024) Klasifikasi Spam Pada Short Message Service (SMS) menggunakan Support Vector Machine. Sarjana thesis, Universitas Brawijaya.

Abstract

Short Message Service (SMS) adalah layanan pesan singkat yang digunakan secara luas dalam berbagai aktivitas sehari-hari, termasuk pemantauan kesehatan, mobile banking, dan mobile commerce. Namun, SMS juga rentan terhadap penyalahgunaan seperti yang dapat mengandung konten berbahaya. Pesan-pesan SMS spam dapat bercampur dengan Pesan-pesan bukan spam sehingga mengganggu pengguna. Oleh karena itu, diperlukan pengelompokan pesan menjadi beberapa kategori agar memudahkan pengguna. Pada penelitian ini, kategori yang digunakan adalah NORMAL, FRAUD, PROMO, AUTH, dan BANK. Data yang digunakan sejumlah 1584 pesan. Data ini dibagi menjadi data latih dan data uji dengan perbandingan 75%:25%. Klasifikasi pesan-pesan tersebut dilakukan menggunakan metode SVM dengan konsep one-against-all. Pada penelitian ini dilakukan preprocessing, term weighting, training, dan testing. Hasil evaluasi yang diperoleh adalah accuracy sebesar 0,95, precision sebesar 0,96, recall sebesar 0,95, dan f1-score sebesar 0,95. Hasil ini diperoleh dengan menggunakan kombinasi parameter C = 100, epsilon = 10-5, konstanta gamma = 0,01, lambda=0,1, dan iterasi maksimum = 50.

English Abstract

Short Message Service (SMS) is a short message service that is widely used in various daily activities, including health monitoring, mobile banking, and mobile commerce. However, SMS is also prone to misuse as it can contain malicious content. Spam SMS messages can be mixed with non-spam messages, thus disturbing users. Therefore, it is necessary to group messages into several categories to make it easier for users. In this research, the categories used are NORMAL, FRAUD, PROMO, AUTH, and BANK. The data used amounted to 1584 messages. This data is divided into training data and test data with a ratio of 75%: 25%. Classification of these messages is done using the SVM method with the concept of one-against-all. In this study, preprocessing, term weighting, training, and testing were carried out. The evaluation results obtained were accuracy of 0.95, precision of 0.96, recall of 0.95, and f1-score of 0.95. These results were obtained using a combination of parameters C = 100, epsilon = 10-5, gamma constant = 0.01, lambda=0.1, and maximum iterations = 50.

Item Type: Thesis (Sarjana)
Identification Number: 052415
Uncontrolled Keywords: klasifikasi teks, SMS, spam, support vector machine
Divisions: Fakultas Ilmu Komputer > Teknik Informatika
Depositing User: soegeng sugeng
Date Deposited: 25 Jul 2024 07:54
Last Modified: 25 Jul 2024 07:54
URI: http://repository.ub.ac.id/id/eprint/223005
[thumbnail of DALAM MASA EMBARGO] Text (DALAM MASA EMBARGO)
Mutiharis Dauber Panjaitan.pdf
Restricted to Registered users only

Download (4MB)

Actions (login required)

View Item View Item