Niel, Ananto and Dr. Dra. Ani Budi Astuti, M.Si. and Achmad Efendi, S.Si., M.Sc., PhD (2022) Analisis Ensemble dalam Klasifikasi Status Kelulusan Mahasiswa di Universitas Klabat – Airmadidi Manado. Magister thesis, Universitas Brawijaya.
Abstract
Analisis klasifikasi adalah sutu metode yang digunakan untuk menemukan model dari data training yang membedakan data ke dalam kategori atau kelas yang sesuai. Salah satu metode klasifikasi yang digunakan adalah teknik ensemble. Teknik ensemble merupakan metode algoritma pembelajaran yang dibangun dari beberapa model pengklasifikasian tunggal, dasar dari metode ensemble ini adalah mengembangkan seperangkat model dari data training lalu, menggabungkan seperangkat model tersebut untuk menentukan klasifikasi akhir. Klasifikasi akhir didasarkan pada kumpulan suara atau voting terbanyak dari gabungan seperangkat model untuk mendapatkan gabungan model terbaik, dalam metode ensemble memungkinan untuk menggunakan beberapa model pengklasifikasi yang berbeda. Metode ensemble yang digunakan dalam penelitian ini adalah Bagging, Boosting dan Random Forest. Penelitian ini bertujuan untuk mengklasifikasi masa studi mahasiswa berdasarkan status lulus tepat waktu atau tidak tepat waktu berdasarkan beberapa variabel prediktor yang diamati yaitu jenis kelamin, Fakultas, Program Studi, asal sekolah, Predikat dan Indeks Prestasi Kumulatif. Sedangkan variabel respon yaitu Masa Studi Mahasiswa. Data yang digunakan merupakan data sekunder yang diperoleh dari sistem informasi Akademik. Hasil studi simulasi menunjukkan bahwa Metode Bagging cenderung lebih baik dilihat dari accuracy, sensitivity, dan specitivity jika dibandingkan dengan Boosting dan Random Forest. Terlebih lagi penambahan jumlah data pada simulasi kedua membuat metode Ensemble Bagging menjadi lebih baik karena accuracy, sensitivity dan specitivity yang meningkat. Pada studi data terapan dengan metode Ensemble didapatkan informasi yang sangat menarik ketika terjadi ketidak seimbangan data yang tinggi, metode Random Forest memiliki hasil yang jauh lebih baik jika dibandingkan dengan metode Bagging Dan Boosting Sedangakan parameter lainnya seperti accuracy dan sensitivity terjadi penuruan. Hasil ini memberikan bukti bahwa metode ensemble fokus pada kelas mayoritas jika dibandingkan dengan kelas minoritas.
English Abstract
Classification analysis is a method used to find models from training data that distinguish data into appropriate categories or classes. One of the classification methods used is the ensemble technique. The ensemble technique is a learning algorithm method that is built from several single classification models, the basis of this ensemble method is to develop a set of models from training data and then combine a set of models to determine the final classification. The final classification is based on a collection of votes or the most votes from a combined set of models to get the best combination of models, in the ensemble method, it is possible to use several different classifier models. The ensemble method used in this research is Bagging, Boosting, and Random Forest. This study aims to classify the student study period based on the status of graduating on time or not on time based on several predictor variables observed, namely gender, faculty, study program, school origin, predicate, and grade point average. While the response variable is the Student Study Period. The data used is secondary data obtained from the Academic information system. The simulation study results show that the Bagging method tends to be better in terms of accuracy, sensitivity, and specificity when compared to Boosting and Random Forest. Moreover, the addition of the amount of data in the second simulation makes the Ensemble Bagging method better because of the increased accuracy, sensitivity, and specificity. In the study of applied data using the Ensemble method, very interesting information was obtained when there was a high data imbalance, the random forest method had much better results when compared to the Bagging and Boosting method. Meanwhile, other parameters such as accuracy and sensitivity decreased. These results provide evidence that the ensemble method focuses on the majority class when compared to the minority class.
Item Type: | Thesis (Magister) |
---|---|
Identification Number: | 042309 |
Uncontrolled Keywords: | Klasifikasi, Bagging, Boosting, Random Forest. - Classification, Bagging, Boosting, Random Forest. |
Divisions: | Fakultas Matematika dan Ilmu Pengetahuan Alam > Statistika |
Depositing User: | Unnamed user with email prayoga |
Date Deposited: | 11 Jan 2024 06:55 |
Last Modified: | 11 Jan 2024 06:55 |
URI: | http://repository.ub.ac.id/id/eprint/208398 |
Text (DALAM MASA EMBARGO)
Niel Ananto.pdf Restricted to Registered users only until 31 December 2025. Download (3MB) |
Actions (login required)
View Item |