Klasifikasi Emosi Manusia Berbasis Teks Menggunakan Pendekatan Model Bahasa Bidirectional Encoder Representations from Transformers (BERT)

De Warut, Gregorius Batara and Dr. Eng. Fitra Abdurrachman Bachtiar,, S.T., M.Eng. and Dr. Lailil Muflikhah, S.Kom., M.Sc. (2024) Klasifikasi Emosi Manusia Berbasis Teks Menggunakan Pendekatan Model Bahasa Bidirectional Encoder Representations from Transformers (BERT). Sarjana thesis, Universitas Brawijaya.

Abstract

Emosi didefinisikan sebagai perasaan yang muncul dalam diri seorang manusia sebagai respon dari situasi tertentu. Perasaan ini bisa memengaruhi pikiran, persepsi dan perilaku seseorang Emosi adalah aspek penting dari pengalaman manusia, dan memahami dinamika emosi manusia telah menjadi fokus utama dalam berbagai disiplin ilmu seperti psikologi, sosiologi, dan ilmu komputer. Aspek penting dalam konsep emosi adalah dampaknya terhadap berbagai aspek kehidupan seseorang. Perasaan yang timbul dapat berpengaruh signifikan terhadap kognisi, persepsi, serta tindakan yang diambil oleh individu. International Survey on Emotion Antecedents and Reactions (ISEAR) adalah sebuah kumpulan pernyataan pribadi tentang kejadian-kejadian emosional yang ditulis oleh 3000 orang dari latar belakang budaya yang berbeda. Kumpulan data ini memuat 8 ribu kalimat yang setiap kalimatnya dilabeli dengan satu emosi. Kategorinya adalah joy, fear, anger, sadness, disgust, shame, and guilt. Penelitian ini bertujuan untuk membuat sebuah model pembelajaran mendalam untuk melakukan klasifikasi emosi menggunakan data ISEAR. Penelitian ini melakukan pengujian pengaruh tahap pra-pemrosesan data terhadap performa model.Dalam pembuatan model, penelitian ini juga melakukan pengujian konfigurasi hyperparameter hidden layer, learning rate, dropout, dan batch size untuk mendapatkan performa model terbaik. Hasil konfigurasi hyperparameter terbaik adalah hidden layer sebesar 64, nilai learning rate sebesar 2e-5, nilai dropout sebesar 0.2 dan nilai batch size sebesar 8 dengan nilai f1, recall, precision, dan akurasi secara berturut-turut adalah 0.7125, 0.7111, 0.7225, 0.7111 untuk pengujian terhadap data tanpa pra-pemrosesan dan untuk pengujian terhadap data dengan pra-pemrosesan menggunakan konfigurasi hyperparameter terbaik mendapatkan nilai f1, recall, precision, dan akurasi secara berturut-turut adalah 0.6454, 0.6450, 0.6475, 0.6444. Penelitian ini juga melakukan pengujian terhadap pengaruh jumlah kelas terhadap performa model dan didapatkan nilai jumlah kelas terbaik adalah sebesar 4 dengan nilai f1, recall, precision, dan akurasi secara berturut-turut adalah 0.8471, 0.8473, 0.8517, 0.8477 tanpa menggunakan pra-pemrosesan data.

English Abstract

Emotions are defined as feelings that arise in a human being in response to a particular situation. Emotions are an important aspect of the human experience, and understanding the dynamics of human emotions has been a major focus in various disciplines such as psychology, sociology, and computer science. An important aspect of the concept of emotions is their impact on various aspects of a person's life. The feelings that arise can significantly affect cognition, perception, and actions taken by individuals. The International Survey on Emotion Antecedents and Reactions (ISEAR) is a collection of personal statements about emotional events written by 3000 people from different cultural backgrounds. The dataset contains 8,000 sentences, each of which is labeled with one emotion. The categories are joy, fear, anger, sadness, disgust, shame, and guilt. This research aims to create a deep learning model for emotion classification using ISEAR data. In building the model, this research also tests the hyperparameter configuration of hidden layer, learning rate, dropout, and batch size to get the best model performance. The results of the best hyperparameter configuration are hidden layer of 64, learning rate value of 2e-5, dropout value of 0.2 and batch size value of 8 with f1, recall, precision, and accuracy values respectively 0.7125, 0.7111, 0.7225, 0.7111 for testing on data without pre-processing and for testing on data with pre-processing using the best hyperparameter configuration getting f1, recall, precision, and accuracy values respectively 0.6454, 0.6450, 0.6475, 0.6444. This research also tested the effect of the number of classes on model performance and obtained the best number of classes of 4 with f1, recall, precision, and accuracy values of 0.8471, 0.8473, 0.8517, 0.8477 without using data pre-processing.

Item Type: Thesis (Sarjana)
Identification Number: 0524150087
Uncontrolled Keywords: Pembelajaran Mendalam, Pemrosesan Bahasa Alami, Klasifikasi Emosi, ISEAR, Transformer, BERT-Deep Learning, Natural Language Processing, Emotion Classification, ISEAR, Transformer, BERT.
Divisions: Fakultas Ilmu Komputer > Teknik Informatika
Depositing User: soegeng sugeng
Date Deposited: 21 Feb 2024 07:39
Last Modified: 21 Feb 2024 07:39
URI: http://repository.ub.ac.id/id/eprint/215620
[thumbnail of DALAM MASA EMBARGO] Text (DALAM MASA EMBARGO)
Gregorius Batara De Warut.pdf
Restricted to Registered users only

Download (4MB)

Actions (login required)

View Item View Item