Studi Perbandingan pada Metode CNN-LSTM dan LSTM dalam Mendeteksi Emosi pada Data Teks Berbahasa Indonesia pada Media Sosial Twitter

Kustiwa, Alwan Fauzul Azhim and Muhammad Aminul Akbar, S.Kom., M.T and Aryo Pinandito, S.T., M.MT., Ph.D (2024) Studi Perbandingan pada Metode CNN-LSTM dan LSTM dalam Mendeteksi Emosi pada Data Teks Berbahasa Indonesia pada Media Sosial Twitter. Sarjana thesis, Universitas Brawijaya.

Abstract

Model deteksi emosi pada data teks memiliki banyak manfaat dalam pengembangan teknologi, salah satunya adalah untuk mengekstrak emosi dari teks yang kemudian di konfigurasikan pada text-to-voice. Salah satu model yang banyak digunakan dalam NLP deteksi emosi adalah LSTM. Menurut beberapa penelitian performa dari LSTM ini bisa ditingkatkan dengan menggabungkannya dengan CNN menjadi CNN-LSTM. Dalam penelitian ini kami akan meneliti perbandingan antara CNN-LSTM dan LSTM dalam mendeteksi emosi ketika dilatih dan dievaluasi menggunakan data Bahasa Indonesia sehari-hari. Penelitian dilakukan dengan melatih dan mengevaluasi model CNN-LSTM dan LSTM dengan menggunakan metode stratified K-Fold Cross Validation untuk melihat konsistensi performa model. Dataset yang digunakan merupakan Bahasa Indonesia sehari-hari yang bersumber dari media sosial. CNN-LSTM dan LSTM akan dilatih dan diuji menggunakan pasangan train-test yang sama pada setiap fold sehingga data performa dari kedua model akan saling berpasangan pada setiap fold. Performa yang diuji antara lain akurasi, precision, recall, f1-score dan loss yang berupa cross entropy loss. Distribusi data performa dari setiap model dilakukan uji hipotesis beda antara kedua model pada setiap metrik. Dari hasil pengujian statistik yang dilakukan, dari 5 metrik yang diuji menunjukan CNN-LSTM hanya memiliki loss yang signifikan lebih rendah daripada LSTM. Sedangkan pada 4 metrik lainnya menunjukan tidak ada perbedaan yang signifikan.

English Abstract

Emotion detection models on text data have many benefits in technology development, one of which is to extract emotions from text which are then configured in text-to-voice.. One model that is widely used in NLP emotion detection is LSTM. According to some research, the performance of LSTM can be improved by combining it with CNN into CNN-LSTM. In this study we will examine the comparison between CNN-LSTM and LSTM in detecting emotions when trained and evaluated using everyday Indonesian data. The research is conducted by training and evaluating CNN-LSTM and LSTM models using the stratified K-Fold Cross Validation method to see the consistency of model performance. The dataset used is everyday Indonesian language sourced from social media. CNN-LSTM and LSTM will be trained and tested using the same train-test pair in each fold so that the performance data of the two models will be paired in each fold. The performance tested includes accuracy, precision, recall, f1- score and loss in the form of cross entropy loss. The distribution of performance data from each model is carried out hypothesis testing of the difference between the two models on each metric. From the results of statistical testing carried out, of the 5 metrics tested, CNN-LSTM only has a loss that is significantly lower than LSTM. While the other 4 metrics show no significant difference.

Item Type: Thesis (Sarjana)
Identification Number: 0524150292
Uncontrolled Keywords: Deteksi Emosi, Klasifikasi, Bahasa Indonesia, CNN-LSTM, LSTM, Uji T Berpasangan, K-Fold Cross Validation-Emotion Detection, Classification, Indonesian Language, CNN-LSTM, LSTM, Paired T Test, K-Fold Cross Validation
Divisions: Fakultas Ilmu Komputer > Sistem Informasi
Depositing User: soegeng sugeng
Date Deposited: 12 Jun 2024 04:34
Last Modified: 12 Jun 2024 04:34
URI: http://repository.ub.ac.id/id/eprint/220579
[thumbnail of DALAM MASA EMBARGO] Text (DALAM MASA EMBARGO)
Alwan Fauzul Azhim Kustiwa.pdf
Restricted to Registered users only

Download (4MB)

Actions (login required)

View Item View Item