Implementasi Metode Text Mining Dan K-Means Clustering Untuk Pengelompokan Dokumen Skripsi (Studi Kasus : Universitas Brawijaya)

Hudin, Muhammad Sholeh (2018) Implementasi Metode Text Mining Dan K-Means Clustering Untuk Pengelompokan Dokumen Skripsi (Studi Kasus : Universitas Brawijaya). Sarjana thesis, Universitas Brawijaya.

Abstract

Penelitian atau tugas akhir merupakan syarat kelulusan mahasiswa. Setiap tahun penelitian menjadi bertambah dan memungkinkan mahasiswa mengambil topik yang sama atau hampir serupa. Melalui penelitian ini dikembangkan sebuah aplikasi untuk mengelompokkan laporan skripsi mahasiswa. Hasil dari pengelompokan laporan skripsi ini akan memperlihatkan bagaimana pola kemiripan dan keterkaitan antar penelitian dari waktu ke waktu. Hasil dari pengelompokan ini juga menunjukkan kapan tema penelitian mahasiswa menjadi bervariasi dan kapan tema penelitian menjadi kurang bervariasi. Laporan penelitian mahasiswa atau biasa disebut dengan laporan skripsi dapat dikelompokkan berdasarkan tema, objek maupun metode dari penelitian tersebut. Proses ekstraksi dokumen skripsi ini dilakukan dengan memanfaatkan teknologi dari text mining. Lalu untuk proses pengelompokan dokumen skripsi ini dilakukan dengan menggunakan metode k-means clustering pada sekumpulan dokumen skripsi dengan mengambil abstrak, kata kunci dan daftar isi sebagai informasi penting yang dapat mewakili isi dari dokumen. Lalu dokumen akan dilakukan preprocessing terlebih dahulu dengan menggunakan metode text mining. Untuk tahap preprocessing dibagi menjadi beberapa bagian, yakni tokenisasi, filtering, stemming dan term weighting. Setelah dokumen melewati tahap preprocessing, maka dokumen dapat dikelompokkan dengan menggunakan metode dari k-means clustering. Pada penelitian ini uji cobs dilakukan dengan memasukkan jumlah cluster yang bervariasi. Dari hasil analisis dengan memasukkan nilai cluster yang berbeda telah didapatkan nilai optimal dengan memasukkan jumlah k = 4 dengan nilai silhouette yang dihasilkan 0,483695522

English Abstract

Research or final assignment is a requirement of graduation students. Every year the research becomes increasing and allows the students to take the same or similar topics. Through this research developed an application to classify student thesis reports. The results of this grouping also indicate that the themes are varied and when the themes becomes non-varied. Student research reports or commonly called a thesis report can be grouped by theme, object or method of the research. The process of extracting this thesis is done by using text mining technology. Then the process of grouping thesis document can be done by using k-means clustering method on a set of thesis documents by taking abstract, keywords and table of contents as an important information that represents the content of the document. Then the document will be done preprocessing first by using text mining method. To process the preprocessing is divided into several parts, namely tokenisasi, filtering, stemming and term weighting. After the document passes through the preprocessing process, then the document can be grouped by using the method of k-means clustering. In this experiment, trials are conducted by entering the number of clusters that vary. From the results of the analysis by entering the different cluster values have obtained the optimal value by entering the number of k = 4 with the resulting silhouette value 0,483695522

Item Type: Thesis (Sarjana)
Identification Number: SKR/FTIK/2018/435/051807595
Uncontrolled Keywords: k-means clustering, silhouette coefficient, clustering dokumen, text mining k-means clustering, silhouette coefficient, clustering document, text mining
Subjects: 000 Computer science, information and general works > 006 Special computer methods > 006.3 Artificial intelligence > 006.31 Machine learning > 006.312 Data mining
Divisions: Fakultas Ilmu Komputer > Teknik Informatika
Depositing User: Budi Wahyono Wahyono
Date Deposited: 20 Mar 2019 07:47
Last Modified: 18 Oct 2021 06:45
URI: http://repository.ub.ac.id/id/eprint/14034
[thumbnail of Muhammad Sholeh Hudin.pdf]
Preview
Text
Muhammad Sholeh Hudin.pdf

Download (37MB) | Preview

Actions (login required)

View Item View Item