Penggunaan Metode Pengelompokan K-Means Pada Klasifikasi KNN Untuk Penentuan Jenis Kanker Berdasarkan Susunan Protein

Kurnianti, Ria (2013) Penggunaan Metode Pengelompokan K-Means Pada Klasifikasi KNN Untuk Penentuan Jenis Kanker Berdasarkan Susunan Protein. Sarjana thesis, Universitas Brawijaya.

Abstract

Kanker merupakan penyebab kematian kedua di dunia. Penyakit ini sulit disembuhkan jika penyebarannya sudah meluas, tetapi dengan pendeteksian dini dapat mengurangi resikonya. Deteksi yang sudah ada selama ini menggunakan biopsy, pengecekan imun maupun CT Scan. Metode pendeteksian tersebut hanya bisa mendeteksi kanker yang sudah meluas. Deteksi dini dapat dilakukan dengan melakukan klasifikasi pada sekuen protein. Metode KNN merupakan salah satu metode klasifikasi yang merupakan bagian dari data mining dimana objek dikelaskan berdasarkan kemunculan kelas terbanyak pada data latih. Disamping biaya komputasi tinggi dan bergantung pada nilai k nya, metode KNN ini tergolong mudah dan efektif digunakan pada data yang besar. Hasil klasifikasi tersebut bergantung pada data latih yang digunakan. Metode KNN dapat dioptimalkan dengan cara mengelompokan data latih sebelum dilakukan proses klasifikasi. Untuk metode pengelompokan yang mampu menangani data dalam jumlah besar dengan waktu komputasi yang cukup cepat dan relative efisien, dapat digunakan metode K-Means. Implementasi penggunaan metode ini dapat memberikan hasil error minimum yang cukup baik, yaitu sebesar 20.00% dan mendapatkan kestabilan nilai error pada saat data sudah terkelompok secara optimal. Data yang digunakan sebanyak 847 data latih dan 135 data uji.

English Abstract

Cancer is the world second dead cause. This disease is hard to cure once it is spread, but with an earlier detection can reduce the cause. The exiting detection so far using biopsy, immune checking or CT Scan. They could only detect cancer that has spread. Early detection could be done by clasificating protein sequence. KNN(K-Nearest Neighbour) method is a classification method which is a part of data mining where the object classified by the most result that occurred in training dataset. Regardless from the computation high cost and the dependence to the K value, this method is quite easy and effective to be use in a large data. Those classification results depend on the training dataset. The KNN method could be optimized by clustering the training dataset before the classification process. Clustering method that capable to handle a large quantity of data with a quite fast computation and relatively efficient, K-Means method can be used. Implementation of using this method could give the quite good minimum error result; it is about 20.00% and achieving stability error where data has been clustered in optimal condition. This research using 847 training dataset and 135 testing data set.

Item Type: Thesis (Sarjana)
Identification Number: SKR/FTIK/2013/29/051300959
Subjects: 000 Computer science, information and general works > 005 Computer programming, programs, data
Divisions: Fakultas Ilmu Komputer > Teknik Informatika
Depositing User: Hasbi
Date Deposited: 01 Apr 2013 10:15
Last Modified: 23 Oct 2021 09:44
URI: http://repository.ub.ac.id/id/eprint/145816
[thumbnail of Ria_Kurnianti(0810963065).pdf] Text
Ria_Kurnianti(0810963065).pdf

Download (5MB)
[thumbnail of Thumbnails conversion from text to thumbnail_lightbox] Other (Thumbnails conversion from text to thumbnail_lightbox)
lightbox.jpg

Download (35kB)
[thumbnail of Thumbnails conversion from text to thumbnail_preview] Other (Thumbnails conversion from text to thumbnail_preview)
preview.jpg

Download (14kB)
[thumbnail of Thumbnails conversion from text to thumbnail_medium] Other (Thumbnails conversion from text to thumbnail_medium)
medium.jpg

Download (4kB)
[thumbnail of Thumbnails conversion from text to thumbnail_small] Other (Thumbnails conversion from text to thumbnail_small)
small.jpg

Download (1kB)

Actions (login required)

View Item View Item