Kurniawati, Neny (2019) Pemodelan Geographically Weighted Quantile Regression (GWQR) Pada Data Indeks Pembangunan Manusia (IPM) di Pulau Jawa Tahun 2017 dan Data Simulasi (Studi Kasus dan Simulasi). Magister thesis, Universitas Brawijaya.
Abstract
Analisis regresi kuantil merupakan suatu metode regresi dengan pendekatan membagi data menjadi kuantil-kuantil tertentu yang kemungkinan memiliki nilai dugaan yang berbeda. Walaupun tidak dikhususkan sebagai metode robust namun regresi kuantil dapat diterapkan pada data yang mengandung pencilan dan memiliki ragam galat yang tidak homogen. Apabila ragam galat tidak homogen maka akan memungkinkan model yang dihasilkan secara global tidak mampu menerangkan keseluruhan data sehingga diperlukan model secara lokal dengan memasukkan unsul spasial. Kondisi yang dipengaruhi oleh unsur spasial memungkinkan adanya heterogenitas spasial. GWR merupakan suatu metode yang dapat digunakan untuk menduga parameter model pada data yang memiliki heterogenitas spasial. Untuk mengakomodir dua aspek sekaligus yaitu eksplorasi hubungan antar variabel yang dipengaruhi faktor heterogenitas spasial dan pola distribusi variabel respon maka dikembangkan Geographically Weighted Quantile Regression (GWQR) dengan mengintegrasikan model GWR dan regresi kuantil. Pada penelitian ini model GWQR diterapkan pada data IPM Pulau Jawa di mana capaian IPM di Pulau Jawa sebarannya sangat beragam dan merupakan suatu permasalahan yang spasial. Pembobot yang digunakan adalah adaptive Gaussian Kernel dan nilai kuantil yang digunakan adalah kuantil 0,05; 0,25; 0,50; 0,75; dan 0,95. Hasil analisis menunjukkan bahwa model GWQR lebih baik daripada model QR global dalam menerangkan hubungan antara umur harapan hidup (tahun), angka partisipasi sekolah usia 16-18 tahun (%), persentase penduduk dengan Pendidikan minimal SMA (%), kepadatan penduduk (km2/jiwa), persentase penduduk miskin (%), dan pengeluaran perkapita (rupiah) terhadap IPM kabupaten/kota di Pulau Jawa. Hal ini terlihat dari hasil prediksi yang dihasilkan model GWQR lebih mendekati nilai IPM yang sebenarnya daripada hasil prediksi yang dihasilkan dari model QR secara global. Untuk mengetahui kekonsistenan model GWQR dalam mengatasi adanya pencilan maka dilakukan pula studi simulasi untuk beberapa persentase pencilan sebesar 5%, 10%, 15%, dan 20% pada data dengan kondisi terdapat dan tidak terdapat heterogenitas spasial. Evaluasi penentuan metode yang terbaik adalah dengan menggunakan nilai RMSE. Hasil analisis menunjukkan bahwa pada data tanpa heterogenitas spasial, nilai RMSE model QR hampir sama dengan model GWQR. Hasil ini diperkuat dengan uji kesamaan dua ragam yang memberikan hasil bahwa ragam model QR dan Model GWQR sama. Sedangkan pada data dengan heterogenitas spasial, hasil uji kesamaan ragam menunjukkan bahwa ragam galat antar dua model QR pada beberapa persentase pencilan berbeda sedangkan ragam galat antar dua model GWQR pada berbagai persentase pencilan adalah sama. Hal ini juga dapat dikatakan bahwa model GWQR lebih konsisten dalam mengatasi adanya pencilan pada berbagai persentase pencilan. Oleh karena itu, berdasarkan nilai RMSE yang relatif lebih kecil yang dilanjutkan dengan uji kesamaan ragam galat dapat dikatakan bahwa model GWQR merupakan model yang lebih baik dari pada model QR pada data yang mengandung heterogenitas spasial dan pencilan dengan beberapa persentase pencilan.
English Abstract
Quantile regression analysis is a regression method with an approach to dividing data into certain quintiles that may have different predictive values. Although it is not specified as a robust method, quantile regression can be applied to data that containing outliers and has a non-homogeneous variance of errors. If the variance of errors is not homogeneous, it's likely that a globally generated model won't be able to explain the entire data so that a locally generated model is needed by including spatial elements. Conditions that are influenced by spatial elements allow for spatial heterogeneity. GWR is a method that can be used to predict model parameters in data that have spatial heterogeneity. To accommodate two aspects at once, namely the the exploration of relation patterns between variables that are influenced by spatial heterogeneity factors and the distribution pattern of response variables, Geographically Weighted Quantile Regression (GWQR) was developed. In this study, the GWQR model was applied to Java Island's HDI data where its achievement was very diverse and a cause for spatial problem. The weight that used in this research is the Adaptive Gaussian Kernel and the quantile value that used is 0.05; 0.25; 0.50; 0.75; and 0.95. The analysis shows that the GWQR model is better than the global QR model in explaining the relationship between life expectancy (years), school enrollment rates aged 16-18 years (%), percentage of the population with minimum high school education (%), population density (km2/soul), percentage of poor people (%), and expenditure per capita (rupiah) towards the IPM of districts/cities in Java Island. This can be seen from the results of the predictions produced by the GWQR model which is closer to the actual IPM value than the prediction results generated from QR models globally. To find out the consistency of the GWQR model in overcoming outliers for data with or without spatial heterogeneity, a simulation study for some outliers of 5%, 10%, 15%, and 20% was carried out. Evaluation of determining the best method is using the RMSE value. The results of the analysis show that for data without spatial heterogeneity, the RMSE value of global QR model and GWQR model is almost the same. These also are supported by a similarity test of two-variance which results in the same variety of QR models and GWQR models. For data with spatial heterogeneity, the results of the similarity test of variance show that the variance of errors between QR models in various percentage of outliers is different while the variance of errors between GWQR models in various percentage of outliers is the same. It can also be said that GWQR model is more consistent in overcoming outliers than the global QR model in various percentage of outliers. Therefore, based on relatively smaller RMSE value and followed by the similarity test of variance it can be concluded that the GWQR model is a better model than the global QR model on data containing spatial heterogeneity and outliers with some percentage of outliers.
Item Type: | Thesis (Magister) |
---|---|
Identification Number: | TES/519.536/KUR/p/2019/041906301 |
Uncontrolled Keywords: | spasial, pencilan, regresi kuantil, GWR, GWQR, simulasi,-spatial, outlier, quantile regression, GWR, GWQR, simulation |
Subjects: | 500 Natural sciences and mathematics > 519 Probabilities and applied mathematics > 519.5 Statistical mathematics > 519.53 Descriptive statistics, multivariate analysis, analysis of variance and covariance > 519.536 Regression analysis |
Divisions: | S2/S3 > Magister Statistika, Fakultas MIPA |
Depositing User: | Endang Susworini |
Date Deposited: | 27 Jul 2022 04:27 |
Last Modified: | 27 Jul 2022 04:27 |
URI: | http://repository.ub.ac.id/id/eprint/192802 |
Text
Tesis Lengkap Neny Kurniawati.pdf Download (3MB) |
Actions (login required)
View Item |