Arista, Eta Prilia (2020) Metode Classification And Regression Trees Dan Analisis Regresi Logistik Biner Untuk Klasifikasi Anak Putus Sekolah Di Provinsi Jawa Timur Tahun 2017. Sarjana thesis, Universitas Brawijaya.
Abstract
CART merupakan metode statistika nonparametrik yang dikembangkan untuk analisis klasifikasi dalam bentuk pohon, baik data untuk variabel respon kategorik ataupun kontinu. Regresi logistik biner adalah analisis yang digunakan untuk menganalisa hubungan antara variabel penjelas bersifat dikotomi yaitu y = 0 (sukses) dan y = 1 (gagal) dengan variabel penjelas. Digunakan metode CART dan analisis regresi logistik biner untuk mengetahui ketepatan klasifikasi pada kedua metode tersebut. Data yang digunakan merupakan data sekunder dan data simulasi, dengan variabel respon pada data simulasi berupa hasil bangkitan mengikuti distribusi binomial, pada data simulasi digunakan ukuran sampel sebesar n = 200, 300 dan 400 dengan proporsi p = 10%, 25% dan 50%. Hasil penelitian menggunakan data simulasi, ketepatan klasifikasi metode CART lebih baik dibandingkan dengan ketepatan klasifikasi pada analisis regresi logistik. Sehingga, analisis menggunakan data simulasi memiliki hasil yang sama dengan data sekunder. Hasil ketepatan klasifikasi menunjukkan metode CART lebih baik dibandingkan analisis regresi logistik biner dengan nilai akurasi sebesar 97.88% dan 69.67%. Berdasarkan metode CART, faktor yang paling mempengaruhi putus sekolah adalah pendidikan terakhir ayah, sedangkan berdasarkan analisis regresi logistik, faktor yang paling mempengaruhi putus sekolah adalah Program Indonesia Pintar (PIP).
English Abstract
CART is a nonparametric statistical method for classification analysis in the form of trees, both for categorical or continuous response variables. Binary logistic regression is an analysis used to analyze the relation between dichotomous explanatory variables are y = 0 (success) and y = 1 (fail) with response variables. The CART method and binary logistic regression analysis are used to determine the best of classification accuracy. The used data is kind of secondary and simulation data, with the response variable in the simulation data in the form od generated results following the binomial distribution, the simulation data used sample sizes of n = 200, 300 and 400 with the proportion of p = 10%, 25% and 50%. The results using simulation data, the accuracy of the CART data testing, the CART method is better than binary logistic regression analysis. Thus, the analysis using simulation data has the same results as secondary data. The results of the classification accuracy show that the CART method is better than the binary logistic regression analysis with an accuracy value of 97.88% and 69.67%. Based on the CART method, the factors that most influences drop outs of is dad
Other obstract
-
Item Type: | Thesis (Sarjana) |
---|---|
Identification Number: | 0520090283 |
Uncontrolled Keywords: | Anak Putus Sekolah, CART, Jawa Timur, Ketepatan Klasifikasi, Regresi Logistik Biner. |
Subjects: | 500 Natural sciences and mathematics > 519 Probabilities and applied mathematics > 519.5 Statistical mathematics > 519.53 Descriptive statistics, multivariate analysis, analysis of variance and covariance > 519.536 Regression analysis |
Divisions: | Fakultas Matematika dan Ilmu Pengetahuan Alam > Statistika |
Depositing User: | ismanto |
Date Deposited: | 22 Feb 2021 06:05 |
Last Modified: | 14 Apr 2023 01:53 |
URI: | http://repository.ub.ac.id/id/eprint/183531 |
Text (DALAM MASA EMBARGO)
0520090283- Eta Prilia Arista.pdf Restricted to Registered users only until 31 December 2023. Download (2MB) |
Actions (login required)
View Item |