Pembuatan Sistem Klasifikasi SMS Menggunakan Metode Naïve Bayes dan TF-IDF

Aldisa, Fausta Ega and Dr. Dian Eka Ratnawati, S.Si., M.Kom (2024) Pembuatan Sistem Klasifikasi SMS Menggunakan Metode Naïve Bayes dan TF-IDF. Sarjana thesis, Universitas Brawijaya.

Abstract

Penipuan melalui pesan singkat (SMS) semakin menjadi ancaman serius dalam masa digital ini. Tujuan penelitian ini adalah untuk mengembangkan sistem deteksi penipuan online berbasis SMS yang menggunakan metode Naive Bayes dan TF-IDF. Dengan menggunakan pembelajaran mesin dan analisis teks, sistem ini dimaksudkan untuk menemukan pola-pola penipuan dalam pesan SMS. Metode Naive Bayes membagi pesan SMS ke dalam dua kategori utama: penipuan dan non-penipuan. Selain itu, teknik TF-IDF (Term Frequency-Inverse Document Frequency) digunakan untuk mengekstrak karakteristik penting dari setiap pesan SMS. Ini memungkinkan sistem untuk mengevaluasi pentingnya kata-kata dalam proses klasifikasi. Untuk melatih dan menguji sistem, data SMS penipuan dan non- penipuan dikumpulkan dalam penelitian ini. Data yang telah dikumpulkan berisi 1161 data dengan pembagian data 569 SMS normal, SMS penipuan sebanyak 344, dan SMS promo sebanyak 248.Hasil eksperimen menunjukkan bahwa sistem dapat mendeteksi penipuan online berbasis SMS dengan tingkat akurasi yang memuaskan dengan 93%, presisi 93%, recall 93%, dan F1-score 93%. Diharapkan bahwa penerapan sistem ini akan membantu mengurangi efek penipuan internet, melindungi pengguna dari kerugian finansial dan kerugian lainnya. Penelitian ini juga dapat membantu kemajuan teknologi keamanan informasi dalam menangani ancaman keamanan di dunia digital.

English Abstract

Fraud through short messages (SMS) is becoming an increasingly serious threat in this digital age. The purpose of this research is to develop an SMS-based online fraud detection system using Naive Bayes and TF-IDF methods. Through machine learning and text analysis, this system aims to identify patterns of fraud in SMS messages. The Naive Bayes method categorizes SMS messages into two main categories: fraud and non-fraud. Additionally, the TF-IDF (Term Frequency-Inverse Document Frequency) technique is utilized to extract important characteristics from each SMS message. This allows the system to assess the importance of words in the classification process. To train and test the system, fraud and non-fraud SMS data were collected in this study. The collected data consisted of 1161 records, including 569 normal SMS messages, 344 fraud SMS messages, and 248 promotional SMS messages. Experimental results indicate that the system can detect online SMS-based fraud with a satisfactory accuracy of 93%, precision of 93%, recall of 93%, and F1-score of 93%. It is expected that the implementation of this system will help reduce the impact of internet fraud, protecting users from financial and other losses. This research can also contribute to the advancement of information security technology in addressing security threats in the digital world.

Item Type: Thesis (Sarjana)
Identification Number: 0524150170
Uncontrolled Keywords: sms, deteksi, naive bayes, tf-idf, penipuan-sms, detection, naïve bayes, tf-idf, fraud
Divisions: Fakultas Ilmu Komputer > Teknologi Informasi
Depositing User: soegeng sugeng
Date Deposited: 27 Feb 2024 07:42
Last Modified: 27 Feb 2024 07:42
URI: http://repository.ub.ac.id/id/eprint/216049
[thumbnail of DALAM MASA EMBARGO] Text (DALAM MASA EMBARGO)
Fausta Ega Aldisa.pdf
Restricted to Registered users only

Download (3MB)

Actions (login required)

View Item View Item