Penjajaran Sekuen Jamak Protein Dengan Algoritma Genetika

MacroJingga, Ceerinda (2016) Penjajaran Sekuen Jamak Protein Dengan Algoritma Genetika. Sarjana thesis, Universitas Brawijaya.

Abstract

Penjajaran sekuen adalah proses dimana sekuen dibandingkan dengan mencari pola karakter yang paling umum dan berhubungan antar sekuen. Penjajaran sekuen jamak adalah proses penjajaran lebih dari dua sekuen yang merupakan dasar dari pencarian kemiripan pada database dan penjajaran banyak sekuen (multiple sequence alignment). Penjajaran sekuen memiliki masalah dalam hal waktu karena semakin panjang sebuah sekuen maka dibutuhkan waktu yang semakin banyak, selain itu sulit mengoptimasi atau sering disebut dengan masalah kombinatorial. Salah satu metode yang dapat menyelesaikan masalah ini adalah algoritma genetika. Algoritma genetika membentuk populasi dari solusi acak lalu menggunakan konsep seleksi alami, crossover dan mutasi yang digunakan untuk mengembangkan solusi tersebut. Algoritma genetika berhasil menghasilkan suatu solusi untuk masalah optimasi yang sulit. Keuntungan yang ditawarkan oleh algoritma ini adalah mengoperasikan beberapa solusi dengan mengkombinasikan solusi terakhir. Pada penelitan sebelumnya jika menggunakan algoritma genetika, menghasilkan hasil yang optimal dan lebih cepat dibandingkan dengan metode pemrogaman dinamis serta algoritma genetika ini inheren parallel sehingga dapat diimplementasikan sangat efisien pada komputer secara parallel. Pada kasus penjajaran sekuen tanpa gaps dan adanya gaps algortima genetika ini menghasilkan solusi yang baik. Bioinformatika adalah bidang ilmu biologi dan ilmu komputer. Data molekuler di dalam ilmu biologi sangat besar dan terus berkembang termasuk database pada protein. Protein adalah salah satu biomolekul yang sangat penting pada manusia yang berperan dalam proses seluler, fungsi enzim, antibody, hormone dan transport molekul. Pada penelitian ini, kami menampilkan bagaimana algoritma genetika dapat membantu dalam menyelesaikan penjajaran sekuen jamak protein. Data sekuen yang digunakan pada pengujian sebanyak 4 dan panjang sekuen maksimal 36. Penghitungan nilai fitness yang digunakan adalah sum of pairs pada blosum62 serta skema affine yang terdiri dari gap open bernilai -11 dan gap extension bernilai -1. Pada penelitian ini algoritma genetika mampu menghasilkan hasil optimasi yang baik dari permasalahan yang komplek dari penjajaran sekuen jamak protein.

English Abstract

Sequence Alignment is the process whereby a sequence compared by looking for patterns of the most common character and inter-related sequences. Multiple sequence Alignment is the process of more than two sequences alignment that the basis of similarity search on the database. Multiple Sequence Alignment have a problem in terms of time because the longer a sequence so it takes more and more, but it is difficult to optimize or often called combinatorial problems. One method that can solve this problem is a genetic algorithm. Genetic algorithms form the population of random solutions and using the concept of natural selection, crossover and mutation are used to develop the solution. Genetic algorithms managed to produce a solution to a difficult optimization problems. The benefits offered by this algorithm is operating several solutions by combining the final solution. In the previous research has been generated if using a genetic algorithm, produce optimal results and faster than the dynamic programming method and the genetic algorithm is inherently parallel so that it can be implemented very efficiently on parallel computers. In the case of sequence alignment without gaps and the gaps genetic algorithms produce good solutions. Bioinformatics is a field the sciences and computer science. Molecular data in the science of biology very large and continued to grow including a database in proteins. Protein is one of biomolekul very important for human being who participate in the process cellular, function an enzyme, antibody, hormone and transport molecules. In this study, we show how a genetic algorithm can help in solving the multiple sequence alignment of protein. Data sequence used for testing is 4 and long sequence maximum 36 .The calculation of value fitness used is sum of pairs with blosum62 and the scheme of affine transformations consisting of gap open -11 and gap extension -1 .This research prove that algorithm genetics capable of produce results good optimize from trouble a complex of the multiple sequence alignment of protein .

Item Type: Thesis (Sarjana)
Identification Number: SKR/FTIK/2016/542/051610825
Subjects: 000 Computer science, information and general works > 005 Computer programming, programs, data
Divisions: Fakultas Ilmu Komputer > Teknik Informatika
Depositing User: Sugiantoro
Date Deposited: 16 Nov 2016 08:31
Last Modified: 21 Oct 2021 17:35
URI: http://repository.ub.ac.id/id/eprint/147116
[thumbnail of Jurnal_Ceerinda_Macro_Jingga_125150100111024.pdf]
Preview
Text
Jurnal_Ceerinda_Macro_Jingga_125150100111024.pdf

Download (2MB) | Preview
[thumbnail of 125150100111024-Ceerinda_Macro_Jingga-Skripsi.pdf]
Preview
Text
125150100111024-Ceerinda_Macro_Jingga-Skripsi.pdf

Download (2MB) | Preview

Actions (login required)

View Item View Item