Sianturi, MianHalasson (2014) Perbandingan Kinerja Metode Naive Bayesian Dengan Metode Improved K-NN Dalam Implementasi Sistem Pengklasifikasian Spam Email. Sarjana thesis, Universitas Brawijaya.
Abstract
Spam filtering adalah suatu proses memilah/klasifikasi email berdasarkan kategorinya( spam/ham ). Proses spam filtering dapat diimplementasikan dengan berbagai metode/algoritma. Metode yang digunakan dalam pengklasifikasian ini adalah improved k-nn dan naive bayes . Improved K-NN melakukan modifikasi penentuan nilai k pada tiap kategorinya. Perbedaan nilai k pada tiap kategori disesuaikan dengan jumlah dokumen latih tiap kategorinya. Sehingga ketika nilai k membesar, hasil kategori tidak terpengaruh pada kategori yang memiliki jumlah dokumen latih yang lebih besar. Sedangkan naive bayes memanfaatkan klasifikasi bayesian dengan asumsi nilai atribut dari kelas yang didefinisikan independen(tidak terpengaruh) atribut yang lain. Kedua metode ini memiliki performa yang berbeda. Dengan perbedaan kinerja yang dihasilkan metode tersebut, maka dilakukan perbandingan performa kinerjanya dalam klasifikasi spam email . Penelitian ini menggunakan 180 data latih dan 50 data uji. Dari 180 data latih, dibagi menjadi 9 skenario pengujian dengan total data latih setiap skenario adalah 100. Dalam setiap pengujian digunakan 100 data latih yang kategorinya bervariasi, dan 50 data uji dengan distribusi kategori yang seimbang. Dari sembilan skenario pengujian yang dilakukan kedua metode didapatkan rata -rata f1measure 0,678 dengan improved k-nn dan 0,602 dengan naive bayes . Dari hasil nilai f1measure , dapat disimpulkan bahwa improved k-nn lebih baik dalam proses pengklasifikasian spam email dibandingkan dengan naive bayes .
English Abstract
Spam filtering is a process of category classification based on spam email.The process of spam filtering can be implemented with various methods. The methods used in this research are improved k-nearest neighbor and naive bayes. Improved K-NN modify the k values for each category classification. The new k values difference for each category adapt by the sum of training document at each category. So when the k values enlarge, the result will not affected to the categories that have a larger sum of training document. While naive bayes utilizing bayesian method clasification with assumption that the value of class atributes is independent from each other. Both of these methods have a different performance. Because of the difference performance by each methods, the performance comparison is done in classification spam emails. This research use 180 training data and 50 test data. From 180 training data, its divided into 9 testing scenario with each scenario have total 100 training data. In each test scenario used 100 training data with varied categories and 50 test data with balance category distribution. From the nine test scenario obtained by the two methods, the average f1measure produced by improved k-nn are 0,678 and 0,602 by naive bayes. From the result of f1measure by the two methods, it can be concluded that improved k-nn are better in classifiying spam email compared to naive bayes.
Item Type: | Thesis (Sarjana) |
---|---|
Identification Number: | SKR/FTIK/2014/56/051402230 |
Subjects: | 000 Computer science, information and general works > 005 Computer programming, programs, data |
Divisions: | Fakultas Ilmu Komputer > Teknik Informatika |
Depositing User: | Endang Susworini |
Date Deposited: | 21 Apr 2014 14:00 |
Last Modified: | 20 Oct 2021 06:36 |
URI: | http://repository.ub.ac.id/id/eprint/146096 |
Preview |
Text
ABSTRAK(v-vi).pdf Download (1MB) | Preview |
Preview |
Text
BAB_III(24-86).pdf Download (5MB) | Preview |
Preview |
Text
BAB_II(6-23).pdf Download (2MB) | Preview |
Preview |
Text
BAB_I(1-5).pdf Download (1MB) | Preview |
Preview |
Text
BAB_IV(87-130).pdf Download (4MB) | Preview |
Preview |
Text
Cover(i).pdf Download (1MB) | Preview |
Preview |
Text
BAB_VI(171-173).pdf Download (2MB) | Preview |
Preview |
Text
DAFTAR_GAMBAR(xiii-xv).pdf Download (1MB) | Preview |
Preview |
Text
DAFTAR_ISI(ix-xii).pdf Download (1MB) | Preview |
Preview |
Text
DAFTAR_PUSTAKA(174-175).pdf Download (1MB) | Preview |
Preview |
Text
DAFTAR_TABEL(xvi_-_xx).pdf Download (2MB) | Preview |
Preview |
Text
LEMBAR_PENGESAHAN(iii).pdf Download (1MB) | Preview |
Preview |
Text
LEMBAR_PERNYATAAN(iv).pdf Download (1MB) | Preview |
Preview |
Text
KATA_PENGANTAR(vii-viii).pdf Download (1MB) | Preview |
Preview |
Text
LAMPIRAN(176-178).pdf Download (1MB) | Preview |
Preview |
Text
LEMBAR_PERSETUJUAN(ii).pdf Download (1MB) | Preview |
Preview |
Text
BAB_V(131-170).pdf Download (2MB) | Preview |
Actions (login required)
View Item |