Implementasi Metode Fuzzy k-Nearest Neighbor (Fk-NN) untuk klasifikasi jenis kanker berdasarkan susunan protein

Utami, Tahtri Nadia (2018) Implementasi Metode Fuzzy k-Nearest Neighbor (Fk-NN) untuk klasifikasi jenis kanker berdasarkan susunan protein. Sarjana thesis, Universitas Brawijaya.

Abstract

Penyakit kanker merupakan penyakit paling mematikan setelah penyakit jantung. Penyebab umum terjadinya kanker adalah mutasi gen yang terjadi pada protein 53 yang berfungsi untuk mengendalikan replikasi DNA sebagai pengatur fungsi sel sehingga menyebabkan kesalahan susunan protein. Susunan protein dijadikan dasar dalam mengklasifikasi jenis kanker yang kemudian dapat membantu menentukan penanganan atau terapi yang tepat. Klasifikasi jenis kanker dilakukan dengan menggunakan metode Fuzzy k-Nearest Neighbor (Fk- NN). Data yang digunakan merupakan 752 data sekuens protein dengan panjang sekuens yaitu 393. Kelas klasifikasi meliputi kelas bukan kanker, kelas kanker payudara, kelas kanker usus dan kelas kanker paru-paru. Metode Fk-NN menghitung derajat keanggotaan masing-masing kelas pada k jarak terkecil dari hasil perhitungan jarak metode k-Nearest Neighbor (k-NN). Rata-rata tingkat akurasi tertinggi yaitu 52.56% dari hasil pengujian menggunakan k-foldvalidation. Nilai k optimal metode Fk-NN adalah k = 5 dengan rata-rata tingkat akurasi sebesar 54.99%. Variasi jumlah data latih yang besar yaitu 90% dari jumlah dataset menghasilkan tingkat akurasi tertinggi sebesar 55.33%.

English Abstract

Cancer is the most deadly disease besides heart disease. A common cause of cancer is gene mutation in protein 53 that serves to control the replication of DNA as a regulator of the cell function resulting in the wrong protein sequence. The protein sequences is used as a basis to classifying the types of cancer and then it can ease in determining the right handling or therapeutics method. The classification of cancer using the Fuzzy k-Nearest Neighbor (Fk-NN) method. The data used are 752 protein sequences with 393 sequence length on every sequence. The classification class includes non-cancer, breast cancer, collorectal cancer and lung cancer. The Fk-NN method calculates the degree of membership of each class at the k smallest distances generated from k-Nearest Neighbor method. The highest average accuracy rate is 52.56% of the test results using kfold- validation. The optimal k value of the Fk-NN method is k = 5 with the average accuracy rate of 54.99%. The large variation in the amount of training data that is 90% of the dataset results in the highest accuracy rate of 55.33%.

Item Type: Thesis (Sarjana)
Identification Number: SKR/FTIK/2018/555/051808399
Uncontrolled Keywords: Klasifikasi, Kanker, Susunan Protein, Fuzzy k-Nearest Neighbor. classification, cancer, protein sequence, Fuzzy k-Nearest Neighbor
Subjects: 600 Technology (Applied sciences) > 616 Diseases > 616.9 Other disease > 616.99 Tumors and miscellaneous communicable diseases > 616.994 Cancers
Divisions: Fakultas Ilmu Komputer > Teknik Informatika
Depositing User: Budi Wahyono Wahyono
Date Deposited: 22 Mar 2019 01:50
Last Modified: 21 Oct 2021 03:08
URI: http://repository.ub.ac.id/id/eprint/161785
[thumbnail of Tahtri Nadia Utami.pdf]
Preview
Text
Tahtri Nadia Utami.pdf

Download (8MB) | Preview

Actions (login required)

View Item View Item