Putra, Bayu Chandra and Dr. Ir. Dian Eka Ratnawati, S.Si., M.Kom and Sabriansyah Rizqika Akbar, S.T., M.Eng.,Ph.D (2024) Optimalisasi Parameter Long Short Term Memory Menggunakan Genetic Algorithm untuk Klasifikasi Fungsi Senyawa Aktif pada Notasi Simplified Molecular Input Line Entry System (SMILES). Magister thesis, Universitas Brawijaya.
Abstract
Kesehatan masyarakat adalah aspek krusial dalam kehidupan manusia, dan pengembangan obat yang efektif menjadi pilar utama dalam memastikan kesejahteraan masyarakat. Penelitian pada bidang kimia berperan penting dalam menemukan senyawa-senyawa kimia aktif yang menjadi landasan utama dalam penemuan obatobatan. Namun, proses identifikasi senyawa kimia aktif memerlukan waktu dan biaya yang besar. Dalam konteks ini, notasi SMILES (Simplified Molecular Input Line Entry System) muncul sebagai metode efisien dalam menganalisis struktur senyawa kimia. Penelitian ini akan menerapkan machine learning, khususnya Long-Short Term Memory (LSTM), untuk meningkatkan analisis notasi SMILES dalam klasifikasi senyawa aktif. LSTM, meskipun telah digunakan secara luas dalam berbagai penelitian, juga memiliki kelemahan tertentu seperti kebutuhan untuk melakukan tuning hyperparameter secara manual. Oleh karena itu, penelitian ini berfokus menggunakan Genetic Algorithm (GA) untuk mengoptimalkan kinerja LSTM dalam mengklasifikasikan notasi SMILES. Metode ini diuji pada dataset SMILES yang mencakup tiga kelas senyawa: kelas alkohol gula, kelas bahan biomedis dan gigi, dan kelas peptida. Hasil penelitian menunjukkan bahwa model GA-LSTM dengan satu lapisan LSTM memberikan akurasi latih sebesar 92,22%, akurasi uji sebesar 89,05%. Dari hasil penelitian ini, penggunaan GA pada model LSTM dapat disimpulkan bahwa dengan melakukan optimasi pada parameter LSTM dapat meningkatkan kinerja model LSTM, sehingga tidak diperlukan melakukan proses tuning hyperparameter secara manual yang akan memakan waktu dan belum tentu mendapatkan parameter terbaik.
English Abstract
Public health is a crucial aspect of human life, and the development of effective drugs is a key pillar in ensuring the well-being of the community. Research in the field of chemistry plays a vital role in discovering active chemical compounds that form the primary basis for drug discovery. However, the process of identifying active chemical compounds requires significant time and resources. In this context, the Simplified Molecular Input Line Entry System (SMILES) notation has emerged as an efficient method for analyzing the structures of chemical compounds. This research will apply machine learning, particularly Long-Short Term Memory (LSTM), to enhance the analysis of SMILES notation in classifying active compounds. Although LSTM has been widely used in various studies, it also has certain weaknesses, such as the need for manual hyperparameter tuning. Therefore, this research focuses on using the Genetic Algorithm (GA) to optimize the performance of LSTM in classifying SMILES notations. The method is tested on a SMILES dataset that includes three classes of compounds: sugar alcohol class, biomedical and dental materials class, and peptide class. The research results indicate that the GA-LSTM model with a single layer of LSTM achieves a training accuracy of 92.22% and a testing accuracy of 89.05%. From this research, the use of GA in the LSTM model can be concluded that optimizing LSTM parameters can improve the performance of the LSTM model, eliminating the need for manual hyperparameter tuning, which can be time-consuming and may not necessarily yield the best parameters.
Item Type: | Thesis (Magister) |
---|---|
Identification Number: | 042415 |
Uncontrolled Keywords: | SMILES, LSTM, Genetic Algorithm, Senyawa Kimia Aktif |
Divisions: | Fakultas Ilmu Komputer > Teknik Informatika |
Depositing User: | soegeng sugeng |
Date Deposited: | 01 Feb 2024 08:28 |
Last Modified: | 01 Feb 2024 08:28 |
URI: | http://repository.ub.ac.id/id/eprint/214051 |
Text (DALAM MASA EMBARGO)
Bayu Chandra Putra.pdf Restricted to Registered users only Download (3MB) |
Actions (login required)
View Item |