Witanto, Sherly (2018) Pengelompokan Fungsi Aktif Senyawa Data SMILES (Simplified Molecular Input Line Entry System) menggunakan Metode K-Means dengan Inisialisasi Pusat Klaster menggunakan Metode Heuristic O(N LogN). Sarjana thesis, Universitas Brawijaya.
Abstract
Senyawa aktif mempunyai salah satu kegunaan sebagai bahan obat-obatan yang mampu mencegah maupun menyembuhkan penyakit. Sebagian senyawa aktif sudah ditemukan fungsinya dan sebagian lagi masih dalam tahap penelitian. Saat ini di Indonesia masih belum ada program yang mampu mengklasifikasi senyawa kimia sebagai obat untuk penyakit tertentu. Notasi SMILES merupakan konversi senyawa kimia dalam bentuk notasi baris. Notasi SMILES mampu memberikan kemudahan pada proses komputerisasi pada klasifikasi senyawa kimia. Klasifikasi atau pengelompokan notasi SMILES dilakukan dengan mengambil nilai 11 fitur atom B,S,N,O,I,F,C,P,CI,Br dan OH yang ada pada senyawa tersebut. Sebelum diproses, untuk mendapatkan nilai fitur dilakukan proses dengan membagi masing-masing jumlah atom dengan panjang senyawanya. Algoritme K-Means merupakan metode klastering yang paling banyak digunakan karena bersifat mudah dan sederhana. Pengelompokan fungsi aktif menggunakan metode K-Means mempunyai kelemahan pada proses inisialisasi klaster yang bersifat random, sehingga digunakan metode heuristic o(n logn) untuk mendapatkan inisial klaster dengan nilai yang lebih baik. Berdasarkan perangkat lunak yang telah dibuat, pengujian dilakukan dengan menggunakan data latih sebanyak 512 dan data uji sebanyak 128. Akurasi yang diperoleh dari pengujian yaitu sebesar 63% dan pengujian menggunakan K-Fold Cross Validation dengan 10 kali pengujian menghasilkan akurasi rata-rata sebesar 52.58%. Pengujian menggunakan K-Means dengan heuristic o(n logn) menghasilkan akurasi yang lebih baik dibandingkan dengan K-Means konvensional.
English Abstract
Active compounds have function as a medicine that can prevent or cure diseases. Some of the active compounds have been known the function and some are still in the research stage. Currently in Indonesia there is still no program that capable to classifying chemical compounds as drugs for certain diseases. SMILES notation is the conversion of chemical compounds in the form of line notation. Notation SMILES able to provide convenience to the process of computerization on the classification of chemical compounds. The classification of the SMILES notation is carried out by taking the values of the B, 5, N, 0, I, F, C, P, CI, Br and OH atoms present in the compound. Before being processed, to get the value of the feature is done by dividing the process of each atom with the length of the compound. K-Means algorithm is the most widely used clustering method because it is easy and simple. The grouping of active function using K-Means method has weakness in random cluster initialization process, so that heuristic method o (n logn) is used to get the cluster initials with better value. Based on the software that has been made, the test is done using 512 of training data and test data as much as 128. Accuracy obtained from the test that is equal to 63% and testing using -K-Fold Cross Validation with 10 times the test produces an average accuracy of 52.58 %. Testing using K-Means with heuristic o (n logn) yielded better accuracy compared to conventional K-Means.
Item Type: | Thesis (Sarjana) |
---|---|
Identification Number: | SKR/FTIK/2018/772/051809192 |
Uncontrolled Keywords: | SMILES, K-Means, Heuristic O(N LogN) |
Subjects: | 600 Technology (Applied sciences) > 681 Precision instruments and other devices > 681.7 Other scientific and technological instruments, machinery, equipment > 681.76 Technological equipment > 681.761 Medical and health equipment |
Divisions: | Fakultas Ilmu Komputer > Teknik Informatika |
Depositing User: | Budi Wahyono Wahyono |
Date Deposited: | 29 Mar 2019 02:05 |
Last Modified: | 22 Oct 2021 04:39 |
URI: | http://repository.ub.ac.id/id/eprint/14000 |
Preview |
Text
Sherly Witanto.pdf Download (21MB) | Preview |
Actions (login required)
View Item |