Nabawi, Saihan and Dr.Eng. Fitra Abdurrachman Bachtiar, S.T., M.Eng and Dr.Eng. Budi Darma Setiawan, S.Kom., M.Cs (2024) Klasifikasi Emosi Pada Teks Tweet Bahasa Indonesia Menggunakan Bert Dan Arsitektur Dual Channel. Sarjana thesis, Universitas Brawijaya.
Abstract
Emosi mempengaruhi sebagian besar tindakan manusia, contohnya adalah persepsi, tindakan, pengambilan keputusan, maupun cara seseorang memahami sesuatu. Emosi tersebut dipengaruhi oleh interaksi manusia dengan lingkungan sekitarnya. Tentu dalam mengekspresikan emosi tersebut manusia pasti berinteraksi dengan sekitarnya baik itu pada sesama makhluk hidup, benda mati, ataupun kepada Tuhan, yang diekspresikan melalui suara, tulisan ataupun yang lainnya. salah satu bentuk ekspresi tersebut adalah menuliskannya melalui tweet. Penelitian sebelumnya telah memberikan hasil yang cukup bagus dalam melakukan klasifikasi emosi, akan tetapi klasifikasis tersebut masih menggunakan bahasa asing, sehingga dirasa masih kurang sesuai dengan pendekatan bahasa Indonesia. Walaupun beberapa penelitian menggunakan bahasa Indonesia, tetapi hasil klasifikasi dirasa masih bisa meningkat. Oleh karena itu Penelitian ini mengusulkan klasifikasi emosi pada tweet berbahasa indonesia menggunakan BERT dan arsitektur dual channel. Arsitektur ini dipilih untuk memanfaatkan keandalan CNN dalam melakukan ekstraksi fitur dan BiLSTM dalam kemampuan untuk mengambil informasi dalam teks. Dalam penelitian ini, digunakan data berbahasa Indonesia. Dataset yang digunakan adalah data teks tweet yang berjumlah 7080 data dan memiliki 6 label data diantaranya Anger, Fear, Happy, Love, Neutral, dan Sad. Proses yang dilakukan pada penelitian ini dimulai dari preprocessing, implementasi, pencarian hyperparameter, dan pengujian dan analisis. Berbagai pengujian dijalankan diantaranya pengujian hyperparameter untuk mendapatkan hyperparameter terbaik untuk melakukan pelatihan. Dilanjutkan dengan pelatihan menggunakan hyperparameter tersebut untuk mendapatkan hasil klasifikasi terbaik. Dan untuk mengetahui kinerja model dalam melakukan klasifikasi emosi dilakukan pula pengujian pada model menggunakan dataset teks emosi berbahasa Indonesia lainnya yang sudah ada. Setelah pengujian maka didapatkan hasil Model BERT dan arsitektur dual channel mampu menghasilkan akurasi pada data latih sebesar 95,12%, akurasi pada data validasi sebesar 96,23% dan data uji sebesar 76,41%. Dan hasil dari pengujian model ini pada dataset emosi lainnya didapatkan 73,92% akurasi pada data uji.
English Abstract
Emotions influence most human actions, for example perception, action, decision making, and the way a person understands something. These emotions are influenced by human interaction with the surrounding environment. Of course, in expressing these emotions, humans must interact with their surroundings, be it fellow living creatures, inanimate objects, or God, which is expressed through sound, writing or other things. one form of expression is writing it via tweet. Previous research has provided quite good results in classifying emotions, however the classification still uses foreign languages, so it is felt that it is still not suitable for the Indonesian language approach. Even though some studies use Indonesian, it is felt that the classification results can still be improved. Therefore, this research proposes classification of emotions in Indonesian language tweets using BERT and dual channel architecture. This architecture was chosen to take advantage of the reliability of CNN in performing feature extraction and BiLSTM in its ability to retrieve information in text. In this research, Indonesian language data was used. The dataset used is tweet text data which amounts to 7080 data and has 6 data labels including Anger, Fear, Happy, Love, Neutral, and Sad. The process carried out in this research starts from preprocessing, implementation, hyperparameter search, and testing and analysis. Various tests were carried out, including hyperparameter testing to get the best hyperparameters for training. Followed by training using these hyperparameters to get the best classification results. And to find out the performance of the model in classifying emotions, testing was also carried out on the model using other existing Indonesian language emotion text datasets. After testing, the BERT model and dual channel architecture were able to produce accuracy on training data of 95.12%, accuracy on validation data of 96.23% and test data of 76.41%. And the results of testing this model on other emotion datasets showed 73.92% accuracy on the test data.
Item Type: | Thesis (Sarjana) |
---|---|
Identification Number: | 052415 |
Uncontrolled Keywords: | BERT, dual channel, Bidirectional LSTM, CNN, treestructured parzen estimator |
Divisions: | Fakultas Ilmu Komputer > Teknik Informatika |
Depositing User: | Annisti Nurul F |
Date Deposited: | 07 Feb 2024 06:46 |
Last Modified: | 07 Feb 2024 06:46 |
URI: | http://repository.ub.ac.id/id/eprint/215843 |
Text (DALAM MASA EMBARGO)
Saihan Nabawi.pdf Restricted to Registered users only Download (3MB) |
Actions (login required)
View Item |