Klasifikasi Komentar Body Shaming Beauty Vlogger Pada YouTube Menggunakan Metode BM25 Dan K-Nearest Neighbor

Prana, Pengkuh Aditya (2019) Klasifikasi Komentar Body Shaming Beauty Vlogger Pada YouTube Menggunakan Metode BM25 Dan K-Nearest Neighbor. Sarjana thesis, Universitas Brawijaya.

Abstract

Beauty vlogger merupakan sebutan untuk orang yang melakukan kegiatan vlog untuk membahas masalah kecantikan dan tutorial make up di YouTube. Para beauty vlogger sering mendapatkan komentar body shaming. Di Indonesia komentar body shaming merupakan sebuah pelanggaran yang diatur dalam Undang-Undang Informasi dan Transaksi Elektronik (UU ITE). Sistem klasifikasi komentar body shaming dapat membantu untuk mengklasifikasi komentar body shaming dengan lebih efisien dan lebih cepat. Tahapan yang dilakukan dalam penelitian ini adalah melakukan pre-processing pada setiap data untuk mencari kata yang menjadi ciri khas untuk setiap data, lalu menghitung term frequency berdasarkan pada jumlah kata yang terdapat pada setiap data, selanjutnya menghitung inverse document frequency , kemudian menghitung score BM25 dan diurutkan, tahap terakhir melakukan klasifikasi K-Nearest Neighbor. Penelitian ini menggunakan 600 data komentar dengan jumlah 300 data kelas body shaming, dan 300 data kelas tidak body shaming. Rata-rata dari keseluruhan pengujian kfold cross validation didapatkan nilai yang tertinggi yaitu precision=0,87153019, recall=0,86666667, f-measure=0,86606885, dan akurasi=0,86666667 pada nilai k=3. Nilai pengujian dengan menggunakan data seimbang jauh lebih baik dari pada pengujian dengan menggunakan data tidak seimbang, dengan nilai rata-rata tertinggi dari pengujian data tidak seimbang yaitu precision = 0,84306693, recall = 0,775, f-measure = 0,7582337, dan akurasi = 0,775.

English Abstract

Beauty vlogger is a term for people who do vlog activities to discuss beauty issues and make up tutorials on YouTube. Beauty vloggers often get body shaming comments. In Indonesia, body shaming comments are a violation regulated in the Electronic Information and Transaction Act (UU ITE). Body shaming comment classification system can help to classify body shaming comments more efficient and faster. The stages carried out in this research are pre-processing each data to look for words that are characteristic for each data, then calculate the term frequency based on the number of words contained in each data, then calculate the inverse document frequency, then calculate the BM25 score and sorting the data. The last step is to do the K-Nearest Neighbor classification. This study uses 600 data comments with 300 data on body shaming class, and 300 data on not body shaming class. The average of all k-fold cross validation tests obtained the highest value, namely precision = 0.87153019, recall = 0.86666667, f-measure = 0.86606885, and accuracy = 0.86666667 at value k = 3. The value of testing using balanced data is much better than testing using unbalanced data, with the highest average value of testing unbalanced data, namely precision = 0.84306693, recall = 0.775, f-measure = 0.7582337, and accuracy = 0.775.

Item Type: Thesis (Sarjana)
Identification Number: SKR/FILKOM/2019/409/051905727
Uncontrolled Keywords: Classification, Pre-processing text, BM25, K-Nearest Neighbor, K-fold cross validaton
Subjects: 000 Computer science, information and general works > 001 Knowledge > 001.012 Classification
Divisions: Fakultas Ilmu Komputer > Teknik Informatika
Depositing User: Endang Susworini
Date Deposited: 01 Aug 2020 08:55
Last Modified: 01 Aug 2020 08:55
URI: http://repository.ub.ac.id/id/eprint/171887
Full text not available from this repository.

Actions (login required)

View Item View Item