Perbandingan Hasil Klasifikasi Model Regresi Logistik Dan Mars Pada Respon Biner (Studi Kasus Pada Lulusan Pelatihan Teknisi Ahli Bbplk Serang)

Adityawardani, Prima (2017) Perbandingan Hasil Klasifikasi Model Regresi Logistik Dan Mars Pada Respon Biner (Studi Kasus Pada Lulusan Pelatihan Teknisi Ahli Bbplk Serang). Magister thesis, Universitas Brawijaya.


Regresi logistik merupakan sebuah metode analisis statistika yang menggambarkan hubungan antara peubah respon bersifat kategorik dengan peubah prediktor bersifat kategorik maupun kontinyu. Sedangkan Multivariate Adaptive Regression Splines (MARS) adalah sebuah pendekatan untuk memodelkan regresi nonparametrik yang baik digunakan ketika peubah prediktor berjumlah banyak dan bersifat tidak linier. Pada regresi logistik dan MARS tidak diperkenankan adanya multikolinieritas karena menyebabkan ragam cenderung besar pada regresi logistik dan penempatan knot yang tidak tepat pada MARS sehingga model yang dihasilkan tidak akurat. Untuk mengatasi masalah multikolinieritas digunakan Analisis Komponen Utama (AKU) untuk gabungan peubah diskrit dan kontinyu yang disebut PCAMIX. PCAMIX dirumuskan sebagai AKU dari total himpunan peubah indikator (biner) dilengkapi dengan peubah kontinyu. Peubah baru yang terbentuk dari PCAMIX tidak saling berkorelasi sehingga dapat digunakan dalam pengklasifikasian pengamatan berdasarkan model regresi logistik dan MARS. Pengujian ketepatan klasifikasi menggunakan accuracy, Noise Signal Ratio (NSR) dan pengujian kesamaan dua proporsi. Tujuan penelitian adalah membandingkan hasil klasifikasi respon biner berdasarkan peubah-peubah yang berpengaruh terhadap status lulusan pelatihan dengan menggunakan regresi logistik dan MARS untuk mendapatkan model pengklasifikasian yang lebih baik melalui nilai accuracy, NSR dan pengujian kesamaan dua proporsi. Penelitian ini menggunakan data sekunder tahun 2013-2015, yaitu status lulusan pelatihan Teknisi Ahli di BBPLK Serang untuk durasi waktu pelatihan 2 tahun. Hasil analisis menunjukkan bahwa berdasarkan faktor-faktor yang berpengaruh terhadap status lulusan yang langsung dan tidak langsung bekerja, yaitu IPK, rata-rata nilai UAN dan usia pada saat lulus pelatihan, maka model pengklasifikasian MARS lebih baik daripada regresi logistik jika didasarkan pada nilai accuracy dan NSR. Sedangkan hasil pengujian kesamaan dua proporsi menunjukkan bahwa kedua model memberikan ketepatan hasil klasifikasi yang sama.

English Abstract

Logistic regression is a statistical analysis method that describes the relation between categorical response variable and categorical or continuous predictor variables. Whereas MARS is an approach modeling nonparametric regression which is used when predictor variables is numerous and not linier. Multicollinearity is not allowed in logistic regression and MARS since it causes largevariance on logistic regression and improperly placing knots on MARS; consequently, the model is less accurate. Principal Component Analysis (PCA) named PCAMIX is suggested to fix multicollinearity problem for combination of qualitative and quantitative variables. PCAMIX is formulated as PCA from the total set of indicator variables (binary) completed by continuous variables. The new variables formed from PCAMIX donot correlate with each other so it can be used for classifiying observation based on logistic regression model and MARS. The test for classification accuracy used accuracy, Noise Signal Ratio (NSR) and the test of two proportions. The aim of this research is to compare the classsification results of binary responses on variables that affecting the quality of training graduates that directly and indirectly worked by using logistic regression and MARS, as well as to get the better model in classification through accuracy, NSR and the test of two proportions. This study used secondary data in 2013-2015 (Teknisi Ahli BBPLK Serang training graduates status for 2 years training program). The results showed that based on variablesthat affecting the quality of training graduates that directly and indirectly worked, the GPA, average of UAN score and age upon graduation training, MARS classification model is better than that of the logistic regression based on the accuracy and NSR. While the test of two proportions result showed that both models provide the same classification results accuracy.

Item Type: Thesis (Magister)
Identification Number: TES/519.536/ADI/p/2017/041708267
Subjects: 500 Natural sciences and mathematics > 519 Probabilities and applied mathematics > 519.5 Statistical mathematics > 519.53 Descriptive statistics, multivariate analysis, analysis of variance and covariance > 519.536 Regression analysis
Divisions: S2/S3 > Magister Statistika, Fakultas MIPA
Depositing User: Nur Cholis
Date Deposited: 07 Sep 2017 04:45
Last Modified: 18 Dec 2020 00:16
