Krisnabayu, Rifky Yunus and Dr. Drs. Achmad Ridok,, M.Kom. and Agung Setia Budi,, S.T., M.T., Ph.D (2022) Prediksi Masa Studi Mahasiswa Menggunakan Random Forest Dengan Seleksi Fitur RF-RFE (Recursive Feature Elimination) dan Particle Swarm Optimization. Magister thesis, Universitas Brawijaya.
Abstract
Program Magister Ilmu Komputer/Informatika adalah salah satu jenjang pendidikan yang diselenggarakan Fakultas Ilmu Komputer Universitas Brawijaya. Program studi ini dapat ditempuh dalam kurun waktu 2 tahun atau 4 semester. Berdasarkan data akademik untuk angkatan 2015 - 2019, persentase mahasiswa yang mampu lulus tepat waktu (3-4 semester) berkisar 41%. Berdasarkan data, maka dapat disimpulkan bahwa jumlah mahasiswa yang lulus tidak tepat waktu lebih banyak dibandingkan mahasiswa yang dapat lulus tepat waktu. Total masa studi yang melebihi standar yang telah ditetapkan dapat mempengaruhi kualitas dari program studi tersebut yang umum disebut akreditasi. Permasalahan mahasiswa yang belum dapat lulus tepat waktu menjadi hal yang perlu dipertimbangkan. Selain memberikan solusi dengan perubahan peraturan tertentu, solusi yang lainnya yakni dengan memanfaatkan bidang ilmu pengetahuan seperti pembelajaran mesin (machine learning). Keluaran dari penelitian ini adalah masa studi mahasiswa dalam bentuk semester. Harapannya adalah ketika mahasiswa diprediksi lulus tidak tepat waktu, maka dapat diambil kebijakan pencegahan. Penelitian ini menggunakan random forest yang dikombinasikan dengan synthetic minority over-sampling technique (SMOTE) untuk resamping dataset, seleksi fitur menggunakan recursive feature elimination (RFE), serta hyperparameter optimization menggunakan particle swarm optimization (PSO). Dataset yang digunakan pada penelitian ini adalah dataset yang memuat nilai seleksi masuk calon mahasiswa yang berjumlah 97 baris data. Hasilnya didapatkan bahwa secara umum setiap metode yang ditambahkan mampu memberikan peningkatan performa. Model RF standar memberikan akurasi 0.55. RF + SMOTE memberikan peningkatan akurasi dari 0.55 menjadi 0.72 atau 30.9%. RF + SMOTE + RFE memberikan peningkatan akurasi dari 0.55 menjadi 0.78 atau 41.8%, dan terakhir RF + SMOTE + RFE + PSO mampu memberikan peningkatakan akurasi 0.55 menjadi 0.81 atau 47.2%. Hasilnya model random forest classifer (RFC) memberikan nilai akurasi, presisi, recall, dan f1-score secara berturut-turut adalah 0.81, 0.81, 0.82, dan 0.81. Hasil tersebut mampu mengungguli algoritma lainnya logistic regression, support vector machine, decision tree, dan lainnya pada pengujian yang telah dilakukan.
English Abstract
Master Program in Computer Science/Informatics is one of the levels of education organized by the Faculty of Computer Science, Universitas Brawijaya. This study program can be achieved in 2 years or 4 semesters Based on academic data for the 2015 - 2019 class, the percentage of students who are able to graduate on time (3-4 semesters) is around 41%. Based on the data, it can be concluded that the number of students who graduated not on time was more than the number of students who graduated on time. The total period of study that exceeds the standard that has been set can affect the quality of the study program which is commonly called accreditation. The problem of students who cannot pass on time is something that needs to be considered. One of the solutions is to utilize scientific fields such as machine learning. The output of this research is the student's study period in the form of semesters. The hope is that when students are predicted to graduate not on time, prevention policies can be taken. This research used random forest combined with minority synthesis over-sampling (SMOTE) techniques for resampling the dataset, feature selection using recursive feature elimination (RFE), and hyperparam eter optimization using particle swarm optimization (PSO). The dataset used in this study is a dataset that contains the value of the admission selection of students which contains 97 data lines. The results show that in general each method added can provide increased performance The standard RF model provides an accuracy of 0.55. RF + SMOTE provides increased accuracy from 0.55 to 0.72 or 30.9%. RF + SMOTE + RFE provides an increase in accuracy from 0.55 to 0.78 or 41.8%, and finally RF + SMOTE + RFE + PSO is able to provide an accuracy increase of 0.55 to 0.81 or 47.2%. As a result, the random forest classifier (RFC) model provides accuracy, precision, recall, and f1-score values of 0.81, 0.81, 0.82, and 0.81 respectively. These results can outperform other logistic regression algorithms, support vector machines, decision trees, and others in the tests that have been carried out.
Item Type: | Thesis (Magister) |
---|---|
Identification Number: | 0422150001 |
Uncontrolled Keywords: | masa studi, pembelajaran mesin, klasifikasi, random forest, synthetic minority over-sampling technique, recursive feature elimination, particle swarm optimization. |
Subjects: | 000 Computer science, information and general works > 004 Computer science |
Divisions: | S2/S3 > Magister Ilmu Komputer, Fakultas Ilmu Komputer |
Depositing User: | Budi Wahyono Wahyono |
Date Deposited: | 12 Jan 2022 06:57 |
Last Modified: | 24 Feb 2022 03:23 |
URI: | http://repository.ub.ac.id/id/eprint/188256 |
Text (DALAM MASA EMBARGO)
Rifky Yunus Krisnabayu.pdf Restricted to Registered users only until 31 December 2024. Download (2MB) |
Actions (login required)
View Item |