Imani, Rahman Kukuh and Ir. Satrio Hadi Wijoyo, S.Si., S.Pd., M.Kom. and Faizatul Amalia (2024) Penerapan Algoritma K-Nearest Neighbor Untuk Klasifikasi Kemampuan Lulusan Siswa dalam Bersaing untuk Mendapatkan Pekerjaan (Studi Kasus: SMK “SORE” Tulungagung). Sarjana thesis, Universitas Brawijaya.
Abstract
Memperoleh pendidikan dalam diri seseorang penting untuk mencapai kesuksesan di dunia kerja. Namun, berdasarkan data Tingkat Pengangguran Terbuka (TPT) dari Badan Pusat Statistik (BPS) menunjukkan bahwa lulusan SMK tahun 2023 memiliki tingkat pengangguran yang lebih tinggi daripada jenjang pendidikan yang lain. Data mining digunakan untuk menemukan pola dari faktor yang mempengaruhi siswa mendapat pekerjaan. Pemilihan algoritma K-Nearest Neighbor (K-NN) karena sifatnya yang sederhana dan efektif pada data kecil hingga sedang. Untuk itu dilakukan penelitian dengan tujuan mengklasifikasikan kemampuan lulusan siswa di SMK “SORE” Tulungagung dalam bersaing untuk mendapatkan pekerjaan. Penelitian ini dilakukan dengan metode Knowledge Discovery in Database (KDD) menggunakan data nilai siswa dan data penelusuran pekerjaan siswa SMK "SORE" Tulungagung lulusan tahun ajaran 2022/2023 dengan 16 atribut nilai mata pelajaran yang berbeda. Data tersebut digunakan untuk mengklasifikasikan siswa menjadi "Mampu" atau "Belum Mampu" dalam penentuan pekerjaan. K-Nearest Neighbor (K-NN) diterapkan dengan variasi nilai k dan ukuran data tes. Kemudian dilakukan pengujian dengan k-fold cross validation untuk melihat konsistensi hasil dari model algoritma klasifikasi yang digunakan. Hasil perbandingan data asli dengan data prediksi didapatkan model K-NN dengan tingkat akurasi tertinggi, yaitu pembagian data latih dan uji 90%:10% dengan nilai tetangga (k) = 5 dapat memprediksi label cukup baik. Namun ada perbedaan pada data prediksi, model memprediksi lebih sedikit siswa yang "Mampu" dan lebih banyak siswa yang "Belum Mampu" daripada data aktual. Hasil model data mining setelah pengujian k-fold cross validation didapatkan menggunakan 10-fold memiliki hasil yang lebih baik daripada 5-fold, dengan accuracy sebesar 59,83%, precision sebesar 57,22%, recall sebesar 64,10%, dan f1- score sebesar 60,10%.
English Abstract
Obtaining education as a person is important to achieve success in the world of work. However, based on data on the Open Unemployment Rate (TPT) from the Central Statistics Agency (BPS) shows that SMK graduates in 2023 have a higher unemployment rate than other education levels. Data mining is used to find patterns from factors that influence students to get jobs. The K-Nearest Neighbor (K-NN) algorithm was chosen because it is simple and effective on small to medium data. Therefore, research was conducted with the aim of classifying the ability of student graduates at SMK “SORE” Tulungagung in competing for jobs. This research was performed using Knowledge Discovery in Database (KDD) method using student grade data and job search data of SMK "SORE" Tulungagung students who graduated in the 2022/2023 academic year with 16 different subject grade attributes. These data are used to classify students into "Able" or "Not Able" in determining employment. K-Nearest Neighbor (K-NN) is applied with a variety of k values and test data sizes. Then testing is done with k-fold cross validation to see the consistency of the results of the classification algorithm model used. The results of comparing the original data with the prediction data obtained by the KNN model with the highest level of accuracy, namely the division of training and test data 90%: 10% with a neighbor value (k) = 5 can predict labels quite well. However, there are differences in the prediction data, the model predicts fewer students who are “Able” and more students who are “Not Able” than the actual data. The results of the data mining model after testing k-fold cross validation obtained using 10-fold have better results than 5-fold, with accuracy = 59.83%, precision = 57.22%, recall = 64.10%, and f1-score = 60.10%.
Item Type: | Thesis (Sarjana) |
---|---|
Identification Number: | 052415 |
Uncontrolled Keywords: | confusion matrix, k-fold cross validation, k-nearest neighbor, pekerjaan, penambangan data-confusion matrix, data mining, job, k-fold cross validation, k-nearest neighbor |
Divisions: | Fakultas Ilmu Komputer > Teknologi Informasi |
Depositing User: | Sugeng Moelyono |
Date Deposited: | 06 Jan 2025 05:56 |
Last Modified: | 06 Jan 2025 05:56 |
URI: | http://repository.ub.ac.id/id/eprint/233663 |
![]() |
Text (DALAM MASA EMBARGO)
Rahman Kukuh Imani.pdf Restricted to Registered users only Download (3MB) |
Actions (login required)
![]() |
View Item |