Penerapan Algoritma C4.5 Untuk Klasifikasi Fungsi Senyawa Aktif Menggunakan Kode Simplified Molecular Input Line System (Smiles)

Rochman, Mochammad Iskandar Ardiyansyah (2018) Penerapan Algoritma C4.5 Untuk Klasifikasi Fungsi Senyawa Aktif Menggunakan Kode Simplified Molecular Input Line System (Smiles). Sarjana thesis, Universitas Brawijaya.

Abstract

Senyawa merupakan hal yang kerap kali ditemukan didunia ini, dengan wujud zat yang merupakan kumpulan dari senyawa. Senyawa sendiri terbagi atas senyawa aktif dan tidak aktif. Senyawa tersebut memiliki fungsi yang mungkin dapat dimanfaatkan untuk beberapa aspek bila memiliki suatu fungsi seperti obat ataupun perangsang suatu hormon bekerja. Notasi SMILES (Simplified Molecular Masukan Line System) ditemukan oleh David Weininger pada tahun 1980. Notasi SMILES memanfaatkan karakter yang ada pada ASCII yang sangat mudah untuk diproses oleh komputer. Proses klasifikasi notasi SMILES akan sangat bermanfaat untuk mengetahu kelas fungsi dari senyawa tersebut. Penelitian ini dilakukan untuk mengklasifikasi fungsi dari senyawa memanfaatkan notasi SMILES dengan menerapkan algoritme C4.5 sedangkan objeknya adalah 2 kelas fungsi senyawa, diantaranya adalah kelas kanker dan metabolisme. Fitur yang diuji dari penelitian sebanyak 11 fitur. Tahap implementasi dari C4.5 dengan objek notasi SMILES adalah dengan menghitung entropi dan gain setiap atribut, kemudian atribut dengan gain tertinggi akan dijadikan atribut akan dan juga noda dibawahnya. Skema pengujian yang dilakukan diantaranya adalah dari teknik diskritisasi, pembagian panjang notasi SMILES, banyak data latih yang digunakan dan cross-validasi. Hasil dari pengujian terbaik ketika teknik diskritisasi yang dilakukan menggunakan teknik diskritisasi entropy-based, melakukan pembagian nilai panjang notasi SMILES pada setiap atribut fitur, dan penggunaan data latih sebanyak mungkin yaitu akan menghasilkan nilai akurasi sebesar 79,34%. Sedangakan akurasi dari pengujian cross-validation menunjukan angka akurasi sebesar 70,18%.

English Abstract

Compounds are things that are often found in this world, with the form of substances which are a collection of compounds. The compound itself is divided into active and inactive compounds. The compound has a function that may be used for several aspects if it has a function such as a drug or a hormone stimulating action. SMILES notation (Simplified Molecular Input Line System) was discovered by David Weininger in 1980. SMILES Notation utilizes the characters that exist in ASCII which are very easy to process by a computer. The SMILES notation classification process will be very useful to find out the function class of the compound. This research was conducted to classify the functions of compounds using SMILES notation by applying the C4.5 algorithm while the object is 2 classes of compound functions, including cancer and metabolic classes. The features tested were 11 features. The implementation phase of C4.5 with the object of SMILES notation is to calculate the entropy and gain of each attribute, then the attribute with the highest gain will be used as an attribute and stain below it. The testing schemes carried out included discretization techniques, length distribution of SMILES notation, lots of training data used and crossvalidation. The results of the best test when the discretization technique is done using entropy-based discretization technique, divides the length value of SMILES notation on each feature attribute, and the use of training data as much as possible, which will produce an accuracy value of 79.34%. While the accuracy of cross-validation testing shows an accuracy rate of 70.18%.

Item Type: Thesis (Sarjana)
Identification Number: SKR/FTIK/2018/803/051809525
Uncontrolled Keywords: Notasi SMILES, Algoritme C4.5, Kanker, Metabolisme SMILES Notation, Algorithm C4.5, Cancer, Metabolism
Subjects: 600 Technology (Applied sciences) > 681 Precision instruments and other devices > 681.7 Other scientific and technological instruments, machinery, equipment > 681.76 Technological equipment > 681.761 Medical and health equipment
Divisions: Fakultas Ilmu Komputer > Teknik Informatika
Depositing User: Budi Wahyono Wahyono
Date Deposited: 20 Mar 2019 02:34
Last Modified: 22 Oct 2021 05:53
URI: http://repository.ub.ac.id/id/eprint/13787
[thumbnail of Mochammad Iskandar Ardiyansyah Rochman.pdf]
Preview
Text
Mochammad Iskandar Ardiyansyah Rochman.pdf

Download (21MB) | Preview

Actions (login required)

View Item View Item