Klasifikasi Dokumen Berita Twitter Menggunakan Metode Fuzzy K-Nearest Neighbor (Fk-Nn) Dengan Term Weighting Berbasis Indeks Dokumen Dan Kelas

Robiansyah, Candra (2017) Klasifikasi Dokumen Berita Twitter Menggunakan Metode Fuzzy K-Nearest Neighbor (Fk-Nn) Dengan Term Weighting Berbasis Indeks Dokumen Dan Kelas. Sarjana thesis, Universitas Brawijaya.

Abstract

Informasi atau berita merupakan kebutuhan bagi setiap manusia. Bahkan seperti halnya media sosial terdapat berbagai macam informasi dari berbagai bidang didalamnya, media news survey pada tahun 2013 menunjukkan 86% informasi didapatkan dari twitter. Dimana survey ini didapat dari responden pengguna twitter. Tidak heran bahwa ada banyak Official account pada twitter. Walaupun suatu Official account memiliki topik berita masing-masing, tidak jarang pula mereka memposting topik lain. Untuk itu diperlukan adanya suatu pengklasifikasian yang didasarkan pada short text berita tersebut, bukan pada Official account. Oleh karena itu pada penelitian ini akan dilakukan pengklasifikasian terhadap short text berita twitter dan melakukan pemilihan metode term weighting terbaik diantara pembobotan kata berbasis dokumen (TF.IDF) dan berbasis kelas (TF.IDF.ICF dan TF.IDF.ICS?F). Metode Fuzzy K-Nearest Neighbor (FK-NN) digunakan untuk proses klasifikasi, karena metode ini lebih baik dibanding metode K-Nearest Neighbor (K-NN) dengan akurasi terbaik sebesar 92%. Dari hasil pengujian term weighting menggunakan berbagai variasi data latih dan nilai k, pembobotan TF.IDF menghasilkan akurasi maksimum sebesar 90%. Untuk Pembobotan kata berbasis kelas TF.IDF.ICF, nilai akurasi tertinggi yang dihasilkan sebesar 92% pada 200 data latih, sedangkan pembobotan TF.IDF.ICS?F bisa menghasilkan akurasi tertinggi mencapai 94% pada penggunaan 500 data latih.

English Abstract

Information or news is a necessity for every people. And even just as social media there are many different kinds of information from various fields therein, media news survey shows in 2013 86 % information obtained from twitter. this survey is gathered from twitter users feedback. No wonder that there are many Official accounts on twitter. However, although an Official accounts have there on news topics, they are not rarely post other topics. It required a classification based on the short of news text, not based on Official account. Therefore, in this study will be done to classified twitter news short text and make selection among the best methods of weighting term based on word document (TF.IDF) and class-based (TF.IDF.ICF and TF.IDF.ICSδF). Fuzzy K-Nearest Neighbor (FK-NN) used to classification process, because the FK-NN method is better than K-Nearest Neighbor (K-NN), with 92% of Accuracy. Results of term weighting test using a variety of training data and the value of k, weighting TF.IDF produce maximum accuracy that is 90%. for weighting term TF.IDF.ICF, the highest value of accuracy is 92% at 200 training set, while the TF.IDF.ICSδF term weighting can produce the highest accuracy reaches 94% in the use of 500 dataset.

Item Type: Thesis (Sarjana)
Identification Number: SKR/FTIK/2017/86/051701183
Subjects: 000 Computer science, information and general works > 005 Computer programming, programs, data
Divisions: Fakultas Ilmu Komputer > Teknik Informatika
Depositing User: Kustati
Date Deposited: 10 Feb 2017 14:24
Last Modified: 21 Oct 2021 02:25
URI: http://repository.ub.ac.id/id/eprint/147521
[thumbnail of LAPORAN_SKRIPSI_125150102111001_CANDRA_ROBIANSYAH.pdf]
Preview
Text
LAPORAN_SKRIPSI_125150102111001_CANDRA_ROBIANSYAH.pdf

Download (11MB) | Preview

Actions (login required)

View Item View Item