Pengaruh Seleksi Fitur Information Gain pada K-Nearest Neighbor untuk Klasifikasi Tingkat Kelancaran Pembayaran Kredit Kendaraan

Mutmainnah, Ulfah (2019) Pengaruh Seleksi Fitur Information Gain pada K-Nearest Neighbor untuk Klasifikasi Tingkat Kelancaran Pembayaran Kredit Kendaraan. Sarjana thesis, Universitas Brawijaya.

Abstract

Kredit macet merupakan satu diantara masalah atau risiko yang sering dihadapi oleh beberapa perusahaan penyedia jasa kredit kendaraan. Masalah tersebut berasal dari perilaku debitur yaitu tidak membayar angsuran tepat waktu. Dalam penentuan kelancaran pembayaran kredit bergantung pada analisis data-data debitur, namun dalam melakukan analisis untuk data dengan jumlah yang besar dapat memakan waktu yang lebih lama. Penelitian ini menggunakan seleksi fitur Information Gain dan algoritme K-Nearest Neighbor untuk menanggulangi masalah efektifitas dan menguji tingkat akurasi klasifikasi tingkat kelancaran pembayaran kredit kendaraan sehingga mengetahui pengaruh dari seleksi fitur. Seleksi fitur Information Gain yang digunakan untuk mengurangi dimensi fitur sehingga diperoleh fitur-fitur yang relevan. Fitur terpilih tersebut kemudian diproses untuk klasifikasi menggunakan algoritme K-Nearest Neighbor. Berdasarkan pengujian dari penelitian ini, diperoleh hasil akurasi tertinggi sebesar 94,44% pada saat pengujian dengan sebaran kelas seimbang menggunakan jumlah fitur 3 dan nilai K=4 sedangkan akurasi terendah diperoleh sebesar 33,33% menggunakan jumlah fitur 10 dengan nilai K=5 pada saat pengujian dengan sebaran kelas tidak seimbang. Fitur yang menghasilkan akurasi tertinggi yaitu pekerjaan, pendapatan dan harga On The Road (OTR). Tiga fitur tersebut merupakan fitur dengan urutan nilai gain terbesar dan memiliki nilai gain lebih dari 0,1.

English Abstract

Intermittent credit is one of the problems or risks that are often faced by some auto loan service providers. The problem stems from the debtor's behavior, namely not paying the installments on time. In determining the smoothness of credit payments depends on the analysis of debtor data, but analyzing for large amounts of data can take up more time. This study uses the Information Gain feature selection and the K-Nearest Neighbor algorithm to overcome the problem of effectiveness and determine the accuracy of the classification level of the smoothness of auto loan payments so as to determine the effect of feature selection. Information Gain feature selection which is used to reduce feature dimensions so that relevant features can be obtained. The selected features are then processed for classification using the K-Nearest Neighbor algorithm. Based on testing from this study, the highest accuracy obtained is 94.44% when testing with a balanced class distribution using the number of features 3 and the value of K = 4 while the lowest accuracy is obtained at 33.33% using the number of features 10 with a value of K = 5 when testing with uneven class distribution. Features that produce the highest accuracy are jobs, income and price on the road (OTR). The three features are features with the largest order of gain values and have a gain value of more than 0.1.

Other obstract

-

Item Type: Thesis (Sarjana)
Identification Number: SKR/FILKOM/2019/661/051907853
Uncontrolled Keywords: kredit kendaraan, seleksi fitur, Information Gain, klasifikasi, K-Nearest Neighbor, credit, feature selection, Information Gain, classification, K-Nearest Neighbor
Subjects: 000 Computer science, information and general works > 001 Knowledge > 001.012 Classification
Divisions: Fakultas Ilmu Komputer > Teknik Informatika
Depositing User: Budi Wahyono Wahyono
Date Deposited: 01 Aug 2020 08:55
Last Modified: 09 Mar 2022 04:23
URI: http://repository.ub.ac.id/id/eprint/174097
[thumbnail of Ulfah Mutmainnah  (2)ok.pdf]
Preview
Text
Ulfah Mutmainnah (2)ok.pdf

Download (5MB) | Preview

Actions (login required)

View Item View Item