Klasifikasi Jenis Kanker Berdasarkan Struktur Protein Menggunakan Metode Neighbor Weighted K-Nearest Neighbor (NWKNN)

Satria, Aldy (2018) Klasifikasi Jenis Kanker Berdasarkan Struktur Protein Menggunakan Metode Neighbor Weighted K-Nearest Neighbor (NWKNN). Sarjana thesis, Universitas Brawijaya.

Abstract

Kanker ialah penyakit tidak menular dengan jumlah pengidap yang besar di dunia. Kanker menjadi penyakit paling mematikan ke-7 di Indonesia. Umumnya kanker terjadi karena adanya mutasi gen yang menyebabkan adanya perubahan pada bentuk protein, salah satunya terjadi pada protein 53 (p53). Mutasi gen p53 ini sering ditemukan pada kanker manusia. Dari permasalahan ini diperlukan sebuah sistem untuk mengklasifikasikan jenis kanker. Salah satu metode yang dapat digunakan untuk klasifikasi adalah metode Neighbor Weighted K-Nearest Neighbor (NWKNN). Data yang digunakan dalam penelitian ini ialah 752 data sekuens protein dengan panjang sekuens adalah 393. Kelas klasifikasi yang digunakan berupa data bukan kanker, kanker payudara, kanker usus dan kanker paru-paru. NWKNN ialah peningkatan dari metode K-Nearest Neighbor (KNN) dengan tambahan perhitungan bobot kelas dalam perhitungan skor kelas klasifikasinya. Pengujian dilakukan dengan membagi dataset menjadi data latih dan data uji dengan varian perbandingan data latih dan data uji sebesar 90%:10%, 80%:20%, 70%:30%, 60%:40%, 50%:50%, 40%:60%, 30%:70%, 20%:80%, 10%:90% dari dataset. Hasil pengujian menunjukkan bahwa variasi perbandingan 80%:20% dengan K=8 dan E=3 menghasilkan akurasi tertinggi, yaitu 80.666%.

English Abstract

Cancer is non-infectious disease with large population in the world. Cancer is ranked on 7th deadliest disease in Indonesia. Mostly cancer happened because of gene mutation that cause changes in protein form,one of them happens in protein 53 (p53). Mutation of gene p53 most commonly found in human cancers. From this case required a system that can classify the types of cancer. One of methods used is Neighbor Weighted K-Nearest Neighbor (NWKNN). Data used in this paper consists of 752 protein sequences data with 393 sequence length. Classification class includes non-cancer, breast cancer, collorectal cancer and lung cancer. NWKNN is improvement of K-Nearest Neighbor (KNN) method with addition of weight class in its classification class scoring calculation. The test is conducted by dividing dataset into training data and testing data with training data and testing data ratio 80%:20%, 70%:30%, 60%:40, 50%:50, 40%:60%, 30%:70%, 20%:80%, 10%:90% from dataset. The result shows that 80%:20% ratio with K=8 and E=3 provided the highest accuracy eate of 80.666%.

Item Type: Thesis (Sarjana)
Identification Number: SKR/FTIK/2018/1076/051901277
Uncontrolled Keywords: klasifikasi, kanker, susunan protein, metode NWKNN-classification, cancer, protein sequence, NWKNN method
Subjects: 600 Technology (Applied sciences) > 616 Diseases > 616.9 Other disease > 616.99 Tumors and miscellaneous communicable diseases > 616.994 Cancers
Divisions: Fakultas Ilmu Komputer > Teknik Informatika
Depositing User: soegeng sugeng
Date Deposited: 30 Oct 2019 02:44
Last Modified: 19 Oct 2021 07:58
URI: http://repository.ub.ac.id/id/eprint/167154
[thumbnail of Aldy Satria.pdf]
Preview
Text
Aldy Satria.pdf

Download (2MB) | Preview

Actions (login required)

View Item View Item