Rochman, Mochammad Iskandar Ardiyansyah (2018) Penerapan Algoritma C4.5 Untuk Klasifikasi Fungsi Senyawa Aktif Menggunakan Kode Simplified Molecular Input Line System (Smiles). Sarjana thesis, Universitas Brawijaya.
Abstract
Senyawa merupakan hal yang kerap kali ditemukan didunia ini, dengan wujud zat yang merupakan kumpulan dari senyawa. Senyawa sendiri terbagi atas senyawa aktif dan tidak aktif. Senyawa tersebut memiliki fungsi yang mungkin dapat dimanfaatkan untuk beberapa aspek bila memiliki suatu fungsi seperti obat ataupun perangsang suatu hormon bekerja. Notasi SMILES (Simplified Molecular Masukan Line System) ditemukan oleh David Weininger pada tahun 1980. Notasi SMILES memanfaatkan karakter yang ada pada ASCII yang sangat mudah untuk diproses oleh komputer. Proses klasifikasi notasi SMILES akan sangat bermanfaat untuk mengetahu kelas fungsi dari senyawa tersebut. Penelitian ini dilakukan untuk mengklasifikasi fungsi dari senyawa memanfaatkan notasi SMILES dengan menerapkan algoritme C4.5 sedangkan objeknya adalah 2 kelas fungsi senyawa, diantaranya adalah kelas kanker dan metabolisme. Fitur yang diuji dari penelitian sebanyak 11 fitur. Tahap implementasi dari C4.5 dengan objek notasi SMILES adalah dengan menghitung entropi dan gain setiap atribut, kemudian atribut dengan gain tertinggi akan dijadikan atribut akan dan juga noda dibawahnya. Skema pengujian yang dilakukan diantaranya adalah dari teknik diskritisasi, pembagian panjang notasi SMILES, banyak data latih yang digunakan dan cross-validasi. Hasil dari pengujian terbaik ketika teknik diskritisasi yang dilakukan menggunakan teknik diskritisasi entropy-based, melakukan pembagian nilai panjang notasi SMILES pada setiap atribut fitur, dan penggunaan data latih sebanyak mungkin yaitu akan menghasilkan nilai akurasi sebesar 79,34%. Sedangakan akurasi dari pengujian cross-validation menunjukan angka akurasi sebesar 70,18%.
English Abstract
Compounds are things that are often found in this world, with the form of substances which are a collection of compounds. The compound itself is divided into active and inactive compounds. The compound has a function that may be used for several aspects if it has a function such as a drug or a hormone stimulating action. SMILES notation (Simplified Molecular Input Line System) was discovered by David Weininger in 1980. SMILES Notation utilizes the characters that exist in ASCII which are very easy to process by a computer. The SMILES notation classification process will be very useful to find out the function class of the compound. This research was conducted to classify the functions of compounds using SMILES notation by applying the C4.5 algorithm while the object is 2 classes of compound functions, including cancer and metabolic classes. The features tested were 11 features. The implementation phase of C4.5 with the object of SMILES notation is to calculate the entropy and gain of each attribute, then the attribute with the highest gain will be used as an attribute and stain below it. The testing schemes carried out included discretization techniques, length distribution of SMILES notation, lots of training data used and crossvalidation. The results of the best test when the discretization technique is done using entropy-based discretization technique, divides the length value of SMILES notation on each feature attribute, and the use of training data as much as possible, which will produce an accuracy value of 79.34%. While the accuracy of cross-validation testing shows an accuracy rate of 70.18%.
Item Type: | Thesis (Sarjana) |
---|---|
Identification Number: | SKR/FTIK/2018/803/051809525 |
Uncontrolled Keywords: | Notasi SMILES, Algoritme C4.5, Kanker, Metabolisme SMILES Notation, Algorithm C4.5, Cancer, Metabolism |
Subjects: | 600 Technology (Applied sciences) > 681 Precision instruments and other devices > 681.7 Other scientific and technological instruments, machinery, equipment > 681.76 Technological equipment > 681.761 Medical and health equipment |
Divisions: | Fakultas Ilmu Komputer > Teknik Informatika |
Depositing User: | Budi Wahyono Wahyono |
Date Deposited: | 20 Mar 2019 02:34 |
Last Modified: | 22 Oct 2021 05:53 |
URI: | http://repository.ub.ac.id/id/eprint/13787 |
Preview |
Text
Mochammad Iskandar Ardiyansyah Rochman.pdf Download (21MB) | Preview |
Actions (login required)
View Item |