Klasifikasi Email Berdasarkan Tingkat Kepentingannya Menggunakan Metode Naive Bayes (Studi Kasus : PT. Green Air Pacific), Bayu Rahayudi, S.T., M.T. dan Bapak Randy Cahya Wihandika, S.ST.,M.Kom.

Chatriavandi, Kevin Nastatur (2021) Klasifikasi Email Berdasarkan Tingkat Kepentingannya Menggunakan Metode Naive Bayes (Studi Kasus : PT. Green Air Pacific), Bayu Rahayudi, S.T., M.T. dan Bapak Randy Cahya Wihandika, S.ST.,M.Kom. Sarjana thesis, Universitas Brawijaya.

Abstract

Pada PT. Green Air Pacific Surabaya jumlah pesan email yang diterima rata - rata sekitar 200 – 700 pesan perhari. Sehingga mengakibatkan email yang masuk akan saling bertumpukan, hal ini dapat menyulitkan proses pengelolaan pesan email yang dianggap penting. Penelitian ini mengklasifikasikan email berdasarkan tingkat kepentingannya menggunakan metode Naive Bayes. Metode pembobotan kata yang digunakan pada dasarnya adalah TF (Term Frequency) kemudian dilakukan normalisasi menjadi pembobotan WIDF (Weighted Inverse Document Frequency). Untuk mendapatkan indeks kata yang lebih baik maka dilakukan modifikasi pembobotan kata dengan menambahkan bobot kata apabila kata tersebut termasuk ke dalam daftar term yang telah ditentukan. Selain itu pengujian dalam penelitian ini dilakukan terhadap judul email, isi email dan juga judul serta isi email. Dari hasil pengujian didapatkan bahwa sistem mengklasifikasikan data email dengan cukup baik. Dapat dibuktikan pada hasil performa tertinggi dengan nilai akurasi sebesar 98,67% , precision sebesar 100% dan f-measure sebesar 98,99% pada parameter penggunaan judul email, pembobotan TF, modifikasi TF dan modifikasi WIDF dengan penggunaan data latih sebanyak 240. Selain itu dari hasil pengujian dan validasi data dengan menggunakan k-fold cross validation juga memberikan rata – rata hasil performa yang tidak jauh berbeda yaitu nilai akurasi sebesar 95,56%, precision sebesar 93,86% dan f-measure sebesar 96,81%.

English Abstract

PT. Green Air Pacific Surabaya has received an average of 400 - 700 messages per day. So that the incoming email will overlap each other, this can complicate the process of managing email messages that are considered important. This study classifies emails based on their importance using the Naive Bayes method. The word weighting method used is basically TF (Term Frequency) and then normalized to WIDF (Weighted Inverse Document Frequency) weighting. To get a better word index, word weighting is modified by adding word weight if the word is included in the list of predetermined terms. In addition, testing in this study was carried out on the email title, email content and email title with content. From the test results, it was found that the system classifies email data quite well. It can be proven on the highest performance results with an accuracy value of 98,67%, a precision of 100% and an f-measure of 98,99% on the parameters of using email headers, TF weighting, modified TF weighting, and modified WIDF weighting with 240 training data. In addition, the results of testing and data validation using k-fold cross validation also provide an average performance result that is not much different, namely an accuracy value of 95,56%, precision of 93,86% and f-measure of 96,81%.

Item Type: Thesis (Sarjana)
Identification Number: 0521150100
Uncontrolled Keywords: Email, Penting , TF, WIDF, Naive Bayes
Subjects: 000 Computer science, information and general works > 004 Computer science
Divisions: Fakultas Ilmu Budaya > Seni Rupa Murni
Depositing User: Budi Wahyono Wahyono
Date Deposited: 04 Nov 2021 01:49
Last Modified: 23 Feb 2022 02:42
URI: http://repository.ub.ac.id/id/eprint/186436
[thumbnail of DALAM MASA EMBARGO] Text (DALAM MASA EMBARGO)
Kevin Nastatur Chatriavandi.pdf
Restricted to Registered users only until 31 December 2023.

Download (2MB)

Actions (login required)

View Item View Item