Klasifikasi Tingkat Stres Berdasarkan Tweet pada Akun Twitter Menggunakan Metode Improved k-Nearest Neighbor dan Seleksi Fitur Chi-square

Maulana, Mohammad Imron (2019) Klasifikasi Tingkat Stres Berdasarkan Tweet pada Akun Twitter Menggunakan Metode Improved k-Nearest Neighbor dan Seleksi Fitur Chi-square. Sarjana thesis, Universitas Brawijaya.

Abstract

Saat ini, media sosial telah menjadi gaya hidup baru bagi masyarakat modern. Salah satu media sosial yang paling populer saat ini adalah Twitter. Di mana pengguna Twitter pada tahun 2018 mencapai 330 juta pengguna. Hal tersebut tidak terlepas dari keunikan Twitter, yaitu membatasi karakter saat membuat tweet atau kicauan. Pembatasan karakter saat men-tweet di twitter membuat pesan yang disampaikan oleh penggunanya menjadi singkat, padat dan jelas. Sehingga, keluh kesah pengguna yang dituangkan dalam sebuah tweet dapat dianalisis menggunakan klasifikasi teks yang kemudian dapat digunakan sebagai metode baru untuk mengetahui tingkat stres dari seseorang. Di mana sampai saat ini, untuk mengetahui tingkat stres masih dilakukan secara manual menggunakan sistem kuesioner. Klasifikasi teks yang digunakan pada penelitian ini adalah metode Improved k-Nearest Neighbor yang merupakan improvisasi dari metode k- Nearest Neighbor yang mempunyai kelemahan dalam penggunaan nilai k terhadap semua kelas. Hal ini bertujuan agar kategori dengan data latih sedikit tidak terpengaruh oleh kategori dengan data latih yang lebih banyak. Selain itu, untuk meningkatkan akurasi dari sistem serta menghilangkan fitur yang kurang relevan maka digunakan seleksi fitur chisquare yang dapat menghilangkan fitur yang kurang relevan tanpa menurunkan akurasi dari sistem. Dari pengujian rasio fitur dan pengaruh seleksi fitur, didapatkan nilai terbaik pada rasio fitur 50% dan k = 20 dengan rata-rata nilai precision sebesar 70%, rata-rata nilai recall sebesar 67,2%, rata-rata nilai accuracy sebesar 83,3% dan rata-rata nilai f-measure sebesar 66,3%. Dari penilitian ini dapat disimpulkan bahwa seleksi fitur dapat meningkatkan rata-rata precision, recall, accuracy, dan f-measure

English Abstract

Today, social media has become a new lifestyle for modern society. Sharing daily activities, location updates, capturing moments and even complaining on social media. One of the most popular social media today is Twitter. Where Twitter users in 2018 reached 330 million users. This is inseparable from the uniqueness of Twitter, which limits the characters when making tweets. The character limitation when tweeting on Twitter makes the message conveyed by its users short, solid and clear. Thus, the complaints of users as outlined in a tweet can be analyzed using text classification which can then be used as a new method to determine the stress level of a person. In which up to this time, to determine the stress level is still done manually using a questionnaire system. The text classification used in this study is the Improved k-Nearest Neighbor method which is an improvisation of the k-Nearest Neighbor method which has a weakness in the use of k values for all classes. It aims to make a category with little training data is not affected by the category with more training data. In addition, to improve the accuracy of the system and eliminate less relevant features, chi-square feature selection is used which can eliminate less relevant features without reducing the accuracy of the system. From the testing of feature ratios and the effect of feature selection, the best value is obtained at the feature ratio of 25% and k = 20 with an average precision value of 70%, the average recall is 67.2%, the average accuracy is 83.3%, and average f-measure is 66.3%. From this research, it can be concluded that feature selection can increase the average precision, recall, accuracy, and fmeasure

Item Type: Thesis (Sarjana)
Identification Number: SKR/FILKOM/2019/369/051905687
Uncontrolled Keywords: twitter, tweet, stress, seleksi fitur, improved k-nearest neighbor, chisquare/twitter, tweet, stress, feature selection, improved k-nearest neighbor, chi-square
Subjects: 000 Computer science, information and general works > 001 Knowledge > 001.012 Classification
Divisions: Fakultas Ilmu Komputer > Teknik Informatika
Depositing User: Endang Susworini
Date Deposited: 01 Aug 2020 08:55
Last Modified: 01 Aug 2020 08:55
URI: http://repository.ub.ac.id/id/eprint/171860
Full text not available from this repository.

Actions (login required)

View Item View Item