Penyaringan spam e-mail menggunakan jaringan syaraf tiruan backpropagation

Zulkarnain, MuhammadRizki (2011) Penyaringan spam e-mail menggunakan jaringan syaraf tiruan backpropagation. Sarjana thesis, Universitas Brawijaya.

Abstract

Electronic mail atau disingkat e-mail merupakan salah satu fasilitas internet yang digunakan untuk mengirimkan pesan secara cepat dan mudah. Email yang tidak diinginkan disebut spam, dan umumnya dikirim secara massal (massmailing). Salah satu tipe spam dapat berupa pesan – pesan bersifat komersial (menjual jasa, barang, perjudian, pornografi atau menawarkan hal lain yang menarik).Salah satu cara untuk pengklasifikasian spam adalah mengunakan metode Jaringan Syaraf Tiruan Backpropagation (JST). Pada penelitian ini akan dicari nilai learning rate yang terbaik untuk penyaringan spam menggunakan metode inisialisasi bobot dan bias awal secara Acak dan menggunakan Nguyen Widrow. Sruktur JST yang dibuat terdiri dari satu lapis input layer yang memiliki 400 neuron, satu lapis hidden layer yang memiliki 100 neuron, dan satu output layer yang memiliki 1 neuron. Untuk pelatihan dan pengujian menggunakan metode inisialisasi Acak dan metode inisialisasi Nguyen Widrow dengan learning rate sebesar 0.7. Jumlah data pembelajaran sebanyak 60 email terdiri dari 30 sampel email spam dan 30 email ham dan data uji sebanyak 80 email, terdiri dari 40 sampel email spam dan 40 email ham (bukan spam ). Pengujian dilakukan dengan jumlah data uji sebanyak 20, 40, 60 dan 80 sampel email. Hasil pengujian menunjukkan bahwa tingkat keakuratan sistem menggunakan metode inisialisasi Nguyen Widrow lebih akurat dari pada metode Acak dengan rata – rata akurasi sebesar 93 %, sedangkan pengujian terhadap data uji ham menggunakan metode inisiliasasi Nguyen Widrow dan metode Acak, memiliki tingkat akurasi yang sama dengan rata – rata akurasi paling tinggi terdapat pada pengujian dengan jumlah sampel 40 ham sebesar 93% .

English Abstract

Electronic mail, or e-mail, is an internet feature that is used to send messages easily and instantly. That easy delivery of messages makes so many people prefer e-mail to regular mail. Yet, the messages that we are received are sometimes unwanted since the content is not that important. Unwanted emails, or spams, are commonly sent massively (massmailing). An example of spam is commercial messages (which are offering services, goods, gambling, pornography, etc). One method to classify spam is using Backpropagation Artificial Neural Network (ANN) which is used in this research. The best learning rate will be sought using Nguyen Widow method compared to random weight and original bias initialization method to filter spams. The ANN structure comprises of an input layer that has 400 neurons, a hidden layer that has 100 neurons, and an output layer that has 1 neuron. For the experiment of Nguyen Widow and random weight and original bias method, the learning rate is setat 0.7, from total 60 learning data, comprise of 30 samples of spam and ham (not spam) for each, and 80 test data comprise of 40 samples of spam and ham for each as well. The experiments are conducted using 20, 40, 60, 80, sample emails. The test result shows that Nguyen Widrow method is more accurate compared to random weight and original bias initialization method with an average of 93%, while an experiment to ham using Nguyen Widrow and random weight and original bias initialization method has the same level of accuracy with the highest average on the experiment with 40 samples of ham by 93%.

Item Type: Thesis (Sarjana)
Identification Number: SKR/MIPA/2011/333/051105059
Subjects: 500 Natural sciences and mathematics > 510 Mathematics
Divisions: Fakultas Matematika dan Ilmu Pengetahuan Alam > Matematika
Depositing User: Unnamed user with email repository.ub@ub.ac.id
Date Deposited: 14 Dec 2011 10:31
Last Modified: 22 Oct 2021 08:14
URI: http://repository.ub.ac.id/id/eprint/152802
[thumbnail of 051105059.pdf]
Preview
Text
051105059.pdf

Download (4MB) | Preview

Actions (login required)

View Item View Item