Mesin Catur Berbasis Neural Network Menggunakan Long Short Term Memory (LSTM)

Fattah, Rafi Indra and Putra Pandu Adikara, S.Kom., M.Kom. and Dr. Eng. Budi Darma Setiawan, S.Kom., M.Cs. (2024) Mesin Catur Berbasis Neural Network Menggunakan Long Short Term Memory (LSTM). Sarjana thesis, Universitas Brawijaya.


Permainan catur telah diperkirakan memiliki sebanyak 1043 kemungkinan posisi, angka tersebut melampaui kemampuan komputasi komputer yang ada bahkan hingga saat ini, maka dari itu, membangun sebuah mesin catur yang mempertimbangkan seluruh kemungkinan posisi dianggap tidak memungkinkan. Saat ini, penggunaan Neural Network dalam pengembangan mesin catur sedang mengalami peningkatan, diawali oleh AlphaZero milik GoogleDeepmind pada tahun 2017, kemudian diikuti oleh pengembangan-pengembangan selanjutnya seperti Leela Chess Zero dan Stockfish NNUE yang dianggap sebagai mesin catur terkuat saat ini, telah menunjukkan bahwa mesin catur berbasis Neural Network akan terus mendominasi di ranah terkait untuk beberapa waktu ke depan. Penelitian ini bertujuan untuk membawa potensi pendekatan baru pada bidang pengebangan mesin catur berbasis Neural Network dengan menggunakan model LSTM sebagai penentu gerakan. Dilatih menggunakan lebih dari 57.000 data pertandingan catur yang terbagi menjadi lebih dari 1.200.000 posisi, model LSTM ini dilatih untuk memprediksi gerakan berikutnya oleh putih dari sebuah posisi yang diberikan, kemudian diimplementasikan dalam sebuah mesin catur yang kompatibel dengan Universal Chess Interface (UCI) untuk menentukan gerakan yang akan dimainkan. Model meraih nilai loss sebesar 3,0 pada data latih, loss sebesar 3,1 pada data uji, dan Average Centipawn Loss (ACPL) sebesar 219 pada data uji setelah 10 epoch pelatihan. Mesin catur yang dihasilkan meraih skor yang tidak memuaskan pada saat pengujian, dengan total 2 kemenangan, 72 kekalahan, dan 10 hasil seri. Mesin catur menunjukkan kinerja yang cukup baik pada fase pembukaan pertandingan, kemudian mengalami penurunan kinerja secara bertahap pada fase pertengahan dan akhir pertandingan. Secara keseluruhan, mesin catur yang dikembangkan pada penelitian ini gagal menghasilkan sebuah mesin catur yang utuh, karena inkonsistensi pada data khususnya pada fase pertengahan dan akhir pertandingan yang sensitif terhadap perbedaan-perbedaan kecil pada posisi, serta hambatan untuk menggunakan lebih banyak data untuk meminimalkan waktu pelatihan.

English Abstract

The game of chess has been estimated to have somewhere around 1043 possible positions, this number surpasses the computing ability of any computer available even until now, therefore, building a chess engine that considers every possible position is deemed impractical. Currently, the use of Neural Network in chess engine development is on the rise, started by Google DeepMind’s AlphaZero in 2017 followed by many developments later such as Leela Chess Zero and Stockfish NNUE which is currently deemed as the strongest chess engine, showing that Neural Network based chess engine is now the way to go. This research aims to bring a new approach to the field of Neural Network based chess engine development by using an LSTM model as move generator. Trained on more than 57.000 games of chess broken down into more than 1.200.000 positions, the model is trained to predict the next move played by white for a given white-to-play position, then implemented by a Universal Chess Interface (UCI) chess engine to decide the next move to be played. The model achieved a loss of 3,0 on the train set, a loss of 3,1 on the validation set, and an Average Centipawn Loss (ACPL) of 219 on the validation set after 10 epochs of training. The resulting chess engine achieved an unpleasing score of 2 wins, 72 losses, and 10 draws on the testing, showing a mediocre performance in the opening, then gradually getting worse as the game reaches middle and ending phase. Overall, the chess engine developed in this research failed to bring a complete chess engine, caused by inconsistency in the data especially in the middle and ending phase that are prone to small differences in positions, and the inability to use more data to minimize training time

