Model Klasifikasi Analisis Diskriminan Dengan Metode Partial Least Squares Discriminant Analysis (PLSDA) Pada Data Berdimensi Tinggi

Zharfani, Durrah Izza (2019) Model Klasifikasi Analisis Diskriminan Dengan Metode Partial Least Squares Discriminant Analysis (PLSDA) Pada Data Berdimensi Tinggi. Sarjana thesis, Universitas Brawijaya.

Abstract

Analisis diskriminan adalah analisis multivariat yang diterapkan untuk memodelkan hubungan antara peubah respon yang bersifat kategorik dengan peubah prediktor yang bersifat numerik. Analisis diskriminan yang memiliki jumlah peubah prediktor lebih banyak daripada jumlah amatannya harus ditangani dengan suatu metode yaitu metode Partial Least Squares Discriminant Analysis (PLSDA). Dampak adanya data berdimensi tinggi mengakibatkan prediksi yang dihasilkan kurang akurat. Salah satu contoh data berdimensi tinggi adalah data berupa gen-gen pada manusia yang menderita suatu jenis kanker. Tujuan penelitian ini adalah untuk mengetahui gen yang paling berpengaruh pada masing-masing jenis kanker. Pada penelitian ini digunakan data dengan jumlah gen sebanyak 685 dan amatan sebanyak 60 pasien yang diklasifikasikan ke dalam lima jenis kanker. Jenis kanker pada penelitian ini adalah BRCA (Breast Carnicoma), COAD (Colon Adenocarcinoma), KIRC (Kidney Renal Clear Cell Carnicoma), LUAD (Lung Adenocarcinoma) dan PRAD (Prostate Adenocarcinoma). Hasil penelitian ini didapatkan gen-gen yang menjadi penciri pada masing-masing jenis kanker. Peubah penciri pada kanker jenis BRCA adalah Gen 452 dan Gen 634. Peubah penciri pada kanker jenis COAD adalah Gen 452 dan Gen 165. Peubah penciri pada kanker jenis KIRC adalah Gen 115 dan Gen 616. Peubah penciri pada kanker jenis LUAD adalah Gen 452 dan Gen 176. Peubah penciri pada kanker jenis PRAD adalah Gen 115 dan Gen 165.

English Abstract

Discriminant analysis is a multivariate analysis that is applied to model the relationship between categorical response variables with numerical predictor variables. Discriminant analysis that has more predictor variables than the number of observations must be handled by a method, such as Partial Least Squares Discriminant Analysis (PLSDA) method. The impact of the existence of high dimension data that the results in less accurate predictions. Example of high dimension data is data in the form of genes in human who suffer from a type of cancer. The purpose of this study was to determine the genes that most influence each type of cancer. In this study, the data used number of genes as much as 685 and the observations of 60 patients which classified into five types of cancer. The types of cancer in this study are BRCA (Breast Carnicoma), COAD (Colon Adenocarcinoma), KIRC (Kidney Renal Clear Cell Carnicoma), LUAD (Lung Adenocarcinoma) and PRAD (Prostate Adenocarcinoma). The results of this study obtained genes that become the characteristics in each type of cancer. Characteristics of cancer in BRCA are Gen 452 and Gen 634. Characteristics of cancer in COAD are Gen 452 and Gen 165. Characteristics of cancer in KIRC are Gen 115 and Gen 616. Characteristics of cancer in LUAD are Gen 452 and Gen 176. Characteristics of cancer in PRAD are Gen 115 and Gen 165.

Other obstract

-

Item Type: Thesis (Sarjana)
Identification Number: SKR/MIPA/2019/510/052001667
Uncontrolled Keywords: Data Dimensi Tinggi, PLSDA, Gen. High Dimension Data, PLSDA, Gen
Subjects: 500 Natural sciences and mathematics > 525 Earth (Astronomical geography) > 525.1 Constants and dimensions
Divisions: Fakultas Matematika dan Ilmu Pengetahuan Alam > Statistika
Depositing User: Budi Wahyono Wahyono
Date Deposited: 10 Aug 2020 07:57
Last Modified: 10 Aug 2020 07:57
URI: http://repository.ub.ac.id/id/eprint/179686
Full text not available from this repository.

Actions (login required)

View Item View Item