M. Hidayat, - and Ir. Indriati, S.T., M.Kom and Ir. Edy Santoso, S.Si., M.Kom (2024) Analisis Sentimen Berbasis Aspek terhadap Ulasan Game Honkai Impact 3rd menggunakan IndoBERT. Sarjana thesis, Universitas Brawijaya.
Abstract
Teknologi di era globalisasi berkembang sangat pesat dan semakin canggih yang didukung dengan koneksi internet menyediakan berbagai fitur hiburan termasuk game online. Honkai Impact 3rd merupakan game RPG aksi 3D dan menjadi objek untuk mengidentifikasi sentimen ulasan pengguna berdasarkan aspek gameplay, performa dan player dengan menggunakan IndoBERT. IndoBERT merupakan model yang telah dipersiapkan sebelumnya berdasarkan BERT untuk bahasa Indonesia. IndoBERT menggunakan dataset Indo4B yang berisi lebih dari 23 GB informasi teks bahasa Indonesia yang terdiri dari 4 miliar kata baik formal maupun sehari-hari dari berbagai sumber. Ketika membangun kosakata, IndoBERT menggunakan SentencePiece dengan tokenizer Byte Pair Encoding (BPE). SentencePiece adalah tokenizer dan detokenizer subkata bebas bahasa yang ditujukan untuk penanganan pesan berbasis otak. Hasil akurasi yang dihasilkan dari percobaan setiap aspek, model dapat bekerja dengan baik dalam klasifikasi. Perubahan nilai batch size menghasilkan perubahan akurasi. Hasil macro average dan weighted average menunjukkan bahwa nilai tersebut berubah-ubah karena dataset yang digunakan tidak seimbang. Berdasarkan performa model IndoBERT, disimpulkan bahwa model mengalami overfitting, data training terlalu baik dalam mengklasifikasi data dengan nilai akurasi pada aspek gameplay sebesar 0,82, nilai akurasi pada aspek performa sebesar 0,75 dan pada aspek player sebesar 0,86.
English Abstract
Technology in the era of globalization is developing very rapidly and is increasingly sophisticated, supported by internet connections, providing various entertainment features including online games. Honkai Impact 3rd is a 3D action RPG game and becomes an object to identify user review sentiment based on gameplay, performance and player aspects using IndoBERT. IndoBERT is a pre-prepared model based on BERT for the Indonesian language. IndoBERT uses the Indo4B dataset which contains more than 23 GB of Indonesian text information consisting of 4 billion words both formal and colloquial from various sources. When building vocabulary, IndoBERT uses SentencePiece with Byte Pair Encoding (BPE) tokenizer. SentencePiece is a language-free subword tokenizer and detokenizer intended for brain-based message handling. The accuracy results generated from the experiments of each aspect, the model can work well in classification. Changes in batch size values result in changes in accuracy. The macro average and weighted average results show that the value is fluctuating because the dataset used is not balanced. Based on the performance of the IndoBERT model, it is concluded that the model experiences overfitting where the training data is too good at classifying data with an accuracy value in the gameplay aspect of 0,82, an accuracy value in the performance aspect of 0,75 and in the player aspect of 0,86.
Item Type: | Thesis (Sarjana) |
---|---|
Identification Number: | 0524150122 |
Uncontrolled Keywords: | analisis sentimen berbasis aspek, ulasan, game, bahasa Indonesia, IndoBERT-aspect-based sentiment analysis, reviews, games, Indonesian, IndoBERT |
Divisions: | Fakultas Ilmu Komputer > Teknik Informatika |
Depositing User: | soegeng sugeng |
Date Deposited: | 23 Feb 2024 07:23 |
Last Modified: | 23 Feb 2024 07:23 |
URI: | http://repository.ub.ac.id/id/eprint/215771 |
Text (DALAM MASA EMBARGO)
M. Hidayat.pdf Restricted to Registered users only Download (6MB) |
Actions (login required)
View Item |