Pengklasifikasian Spam Email Menggunakan Algoritma Improved K-Nearest Neighbors

Andriana,Ria (2012) Pengklasifikasian Spam Email Menggunakan Algoritma Improved K-Nearest Neighbors. Sarjana thesis, Universitas Brawijaya.

Abstract

Electronic Mail ( email ) merupakan salah satu fasilitas komunikasi yang paling banyak digunakan di internet, dimana data dikirim secara elektronik ke satu atau lebih penerima. Karena kemudahan fasilitas email tersebut, maka banyak pihak yang memanfaatkannya seperti untuk mempromosikan sesuatu, atau mengirim pesan tanpa tujuan tertentu dengan bertubi-tubi dan secara massal. Penyebaran email yang tidak diinginkan akan menjadi sampah atau spam bagi penerima. Algoritma k-Nearest Neighbors ( k-NN ) merupakan salah satu metode yang dapat digunakan dalam penyaringan spam email . Algoritma k-NN melakukan klasifikasi terhadap suatu dokumen dengan cara melakukan perhitungan nilai similaritas antar dokumen. Nilai similaritas sejumlah k terbesar menunjukkan kategori untuk dokumen tersebut. Sehingga performa sistem pada algoritma k-NN sangat dipengaruhi oleh nilai k yang digunakan. Ketika ditetapkan nilai k yang terlalu kecil, menghasilkan akurasi yang rendah karena hasil kategorisasi dokumen akan lebih terpengaruh dengan noise . Dan jika ditetapkan nilai k yang terlalu tinggi dapat mengurangi efek noise tetapi membuat akurasi menjadi rendah karena hasil kategorisasi dokumen baru lebih terpengaruh dengan kategori yang memiliki jumlah dokumen latih lebih besar. Karena jumlah dokumen latih pada tiap kategori tidak sama, maka untuk mengatasi permasalahan tersebut, diterapkan algoritma Improved k-NN . Algoritma Improved k-NN melakukan proporsi terhadap nilai k yang digunakan dilakukan dengan cara menyesuaikan nilai k dengan jumlah dokumen pada tiap-tiap kategori. Selanjutnya dilakukan penentuan kategori suatu dokumen berdasarkan sejumlah n similaritas dokumen tertinggi pada kategori tersebut yang dibandingkan dengan sejumlah n similaritas dokumen tertinggi pada semua kategori. Sistem pengklasifikasian spam email menggunakan algoritma Improved k-NN mengklasifikasikan email spam dengan nilai precision rata-rata 75,48% recall sebesar 64,89%, dan F-Measure sebesar 59,33%. Percobaan yang dilakukan menunjukkan bahwa algoritma Improved k-NN mempunyai performa lebih baik sebesar 6,37% dibandingkan dengan menggunakan algoritma k-NN tradisional.

Item Type: Thesis (Sarjana)
Identification Number: SKR/MIPA/2012/114/051200868
Subjects: 500 Natural sciences and mathematics > 510 Mathematics
Divisions: Fakultas Matematika dan Ilmu Pengetahuan Alam > Matematika
Depositing User: Endang Susworini
Date Deposited: 06 Jul 2012 13:41
Last Modified: 22 Oct 2021 16:56
URI: http://repository.ub.ac.id/id/eprint/152949
[thumbnail of 051200868.pdf]
Preview
Text
051200868.pdf

Download (5MB) | Preview

Actions (login required)

View Item View Item