Optimasi Metode Penanganan Missing Values pada Incomplete Data Training

DurratunNafisah (2011) Optimasi Metode Penanganan Missing Values pada Incomplete Data Training. Sarjana thesis, Universitas Brawijaya.

Abstract

Dalam pengolahan data diharapkan dapat menghasilkan informasi yang akurat. Namun dalam kenyataannya seringkali data tidak lengkap karena terdapat beberapa data yang kosong. Hal tersebut tentu mempengaruhi keakuratan informasi yang dihasilkan dalam pengolahan data. Oleh karena itu perlu dilakukan upaya untuk menjaga agar informasi yang dihasilkan dari pengolahan data yang tidak lengkap tersebut tetap memiliki keakuratan yang tinggi. Salah satu upaya yang dapat dilakukan adalah melakukan penanganan terhadap data-data yang hilang (missing value). Penanganan missing value dapat dilakukan dengan beberapa metode. Dalam skripsi ini digunakan metode Mean Imputation dan KNN Imputation untuk diimplementasikan pada data bertipe kuantitatif. Selain itu, metode yang digunakan adalah Mode Imputation dan KNN Imputation untuk diimplementasikan pada data bertipe kualitatif. Nilai yang dihasilkan dari metode penanganan missing value selanjutnya dibandingkan dengan nilai sebenarnya dari data tersebut. Dari proses tersebut dapat diperoleh nilai keakuratan dari hasil penanganan. Hasil dari penelitian ini menunjukkan bahwa jumlah record dan jumlah missing value cukup mempengaruhi kinerja dari masing-masing metode. Pada tipe data kuantitatif, metode penanganan Mean Imputation sedikit lebih unggul dari KNN Imputation dengan rata-rata tingkat kesalahan sebesar 20.83%. Sedangkan pada tipe data kualitatif, metode penanganan KNN Imputation lebih unggul dari Mode Imputation dengan rata-rata tingkat kesalahan sebesar 2.02%.

English Abstract

In the data processing is expected to produce accurate information. But in reality the data is often incomplete because there are some data that is missing. It affects the accuracy of the information generated in the processing of data. Therefore efforts are needed to keep the information generated from incomplete data processing still maintains high accuracy. One of the effort that can be done is handling the missing value. Handling missing value can be done with several methods. In this paper Mean Imputation and KNN Imputation methods were implemented in quantitative data types. In addition, Mode Imputation and KNN Imputation methods were implemented in qualitative data types. The generated value from the method of handling missing value then compared with the actual value of the data. From that process, accuracy value of handling result can be obtained. The result of this research indicate that the number of records and the number of missing value is affecting the performance of each method. In quantitative data types, methods of handling the Mean Imputation slightly superior to the KNN Imputation with an average error rate of 20,83%. While the qualitative data types, KNN Imputation treatment method is superior to Modus Imputation with an average error rate of 2,02%.

Item Type: Thesis (Sarjana)
Identification Number: SKR/MIPA/2011/20/051100404
Subjects: 500 Natural sciences and mathematics > 510 Mathematics
Divisions: Fakultas Matematika dan Ilmu Pengetahuan Alam > Matematika
Depositing User: Unnamed user with email repository.ub@ub.ac.id
Date Deposited: 14 Feb 2011 08:56
Last Modified: 22 Oct 2021 07:44
URI: http://repository.ub.ac.id/id/eprint/152656
[thumbnail of 051100404.pdf]
Preview
Text
051100404.pdf

Download (4MB) | Preview

Actions (login required)

View Item View Item