Seleksi Fitur Alternative Accuracy2 Pada Analisis Sentimen Mengenai Kebijakan Pembatasan Sosial Berskala Besar dengan K-Nearest Neighbor Pembimbing: Yuita Arum Sari, S.Kom., M.Kom. dan Putra Pandu Adikara, S.Kom., M.Kom.

Pembatasan Sosial Berskala Besar (PSBB) adalah kebijakan yang dikeluarkan pemerintah dalam upaya menekan penyebaran pandemi COVID-19. Pemberlakuan kebijakan PSBB menuai berbagai pendapat di berbagai pihak masyarakat dan menjadi topik yang ramai dibicarakan pada media sosial Twitter yang menimbulkan pro kontra. Melalui opini publik tersebut, didapatkan informasi-informasi tentang pelaksanaan kebijakan PSBB yang cenderung bersifat positif atau negatif. Analisis sentimen digunakan untuk mengekstrak data yang berupa teks untuk mendapatkan informasi yang terkandung dalam suatu data. Ukuran data yang berlebihan dapat menjadi permasalahan dalam proses klasifikasi sentimen, maka diperlukan tahap seleksi fitur untuk menghilangkan kata-kata yang tidak relevan dengan data. Fokus penelitian ini yaitu pada pengaruh seleksi fitur Alternative Accuracy2 terhadap hasil klasifikasi dengan menggunakan metode klasifikasi K-Nearest Neighbor (KNN). Data kelas seimbang yang digunakan berjumlah 300 opini masyarakat dan menggunakan K-Fold Cross Validation untuk proses validasi. Hasil evaluasi rata-rata dari 5-fold untuk penggunaan seleksi fitur Allternative Accuracy2, yaitu sebesar 0,7367 untuk nilai accuracy dengan precision 0,7667, nilai recall 0,7277, serta f-measure 0,7453 dengan nilai k pada KNN bernilai k = 47, sedangkan K-Nearest Neighbor tanpa menggunakan seleksi fitur menghasilkan 0,7167 untuk nilai accuracy, 0,7467 untuk precision, 0,7049 untuk recall, dan 0,7249 untuk f-measure. Berdasarkan hasil tersebut dapat disimpulkan bahwa penggunaan seleksi fitur Alternative Accuracy2 dapat meningkatkan nilai evaluasi karena fitur yang dihasilkan dapat memperjelas ciri dari setiap dokumen.

English Abstract

Regarding Large-Scale Social Restriction Policies is one of Indonesian Goverment new policies to surpress the spread of COVID-19 pandemic. This policy generates lots of public opinion about pros and cons, and it became the most discussed topic in social media such as Twitter. From this public opinion, we can get the information about the act of PSBB wich can be classify as it either positive opinion or negative opinion. Sentiment analysis is used to extract information from data text, to get to know whats the point behind every opinion. Excessive data size has become the main problem about text classification, there's a step called feature selection, this step is used to eliminate the unnecessery words in data. In this research, we aim to know the effect of Alternative Accuracy2 feature selection that used with classification method like K-Nearest Neighbor (KNN) on classification result. We used data text with total about 300 public opinion and used K-Fold K-Fold Cross Validation as validation process. The average evaluation results of 5-fold for the use of the Allternative Accuracy2 feature selection, which is equal to 0,7367 for the accuracy value with 0,7667 for precision, 0,7277 for recall, and the f-measure is 0,7453 with a k value in KNN k = 47, while K-Nearest Neighbor without using feature selection resulted in 0,7167 for accuracy, 0,7467 for precision, 0,7049 for recall, and 0,7249 for f-measure. Based on these results, it can be concluded that the use of Alternative Accuracy2 feature selection can increase the evaluation value because the resulting features can clarify the characteristics of each document.

