Furqan Maulana Pranata and Ir. Satrio Hadi Wijoyo, S.Si., S.Pd., M.Kom and Ir. Nanang Yudi Setiawan, S.T., M.Kom. (2024) Analisis Performa Algoritma K-Means Dan Dbscan Dalam Segmentasi Pelanggan Dengan Pendekatan Model Rfm. Sarjana thesis, Universitas Brawijaya.
Abstract
In an increasingly competitive era of globalization, the intensification of competition in the business world requires effective strategies to achieve competitive advantage. Customer segmentation is an important step to understand the market and target the right customer groups. This research aims to analyze the performance of the K-Means and DBSCAN algorithms in customer segmentation using the RFM (Recency, Frequency, Monetary) model approach. This research uses five different apparel retail datasets to test the performance of the two clustering algorithms. The RFM model is used to group customers based on transaction behavior, which includes how recently the customer made a purchase (recency), how often the customer made purchases (frequency), and how much money the customer spent when making a transaction (monetary). The research methodology includes literature study, data collection, data preprocessing, RFM extraction, data standardization, and clustering using the K�Means and DBSCAN algorithms. Evaluation of clustering results was carried out using the Silhouette Score and Davies-Bouldin Index (DBI) matrices. The research results show that both algorithms have advantages and disadvantages depending on the dataset's characteristics. K-means clustering is more efficient for large amounts of data but is sensitive to the initial centroid selection. DBSCAN Clustering excels at handling data with noise and can form clusters with arbitrary shapes, but has difficulty handling high-dimensional datasets. The best clustering results were produced by K-Means with a silhouette score of 0.547 and a DBI index value of 0.640 which was the result of the first dataset. Meanwhile, DBSCAN produced good clustering results with a silhouette score of 0.767 and a DBI index value of 0.731, which is the result of the second dataset. This study concludes that there is no universally better algorithm, but its effectiveness depends on the characteristics of the appropriate dataset. It is hoped that this research can provide insight for companies in optimizing business strategies with a deeper understanding of dataset characteristics and the application of effective methods.
English Abstract
Dalam era globalisasi yang semakin kompetitif, intensifikasi persaingan di dunia bisnis memerlukan strategi yang efektif untuk meraih keunggulan kompetitif. Segmentasi pelanggan merupakan langkah penting untuk memahami pasar dan menargetkan kelompok pelanggan yang tepat. Penelitian ini bertujuan untuk menganalisis performa algoritma K-Means dan DBSCAN dalam segmentasi pelanggan dengan pendekatan model RFM (Recency, Frequency, Monetary). Penelitian ini menggunakan lima dataset retail apparel yang berbeda untuk menguji performa kedua algoritma clustering tersebut. Model RFM digunakan untuk mengelompokkan pelanggan berdasarkan perilaku transaksi, yang mencakup seberapa baru pelanggan melakukan pembelian (recency), seberapa sering pelanggan melakukan pembelian (frequency), dan berapa jumlah uang yang dihabiskan pelanggan saat bertransaksi (monetary). Metodologi penelitian meliputi studi literatur, pengumpulan data, preprocessing data, ekstraksi RFM, standardisasi data, dan proses clustering menggunakan algoritma K-Means dan DBSCAN. Evaluasi hasil clustering dilakukan menggunakan matriks Silhouette Score dan Davies-Bouldin Index (DBI). Hasil penelitian menunjukkan bahwa kedua algoritma memiliki kelebihan dan kekurangan masing-masing tergantung pada karakteristik dataset. K-Means Clustering lebih efisien untuk data dengan jumlah besar, namun sensitif terhadap pemilihan centroid awal. DBSCAN Clustering unggul dalam menangani data dengan noise dan dapat membentuk cluster dengan bentuk arbitrer, namun kesulitan dalam menangani dataset berdimensi tinggi. Hasil clustering paling baik yang dihasilkan K-Means dengan silhouette score 0.547 dan nilai indeks DBI 0.640 yang merupakan hasil dataset pertama. Sedangkan hasil clustering yang baik dihasilkan DBSCAN dengan silhouette score 0.767 dan nilai indeks DBI 0.731 yang merupakan hasil dataset kedua. Kesimpulan penelitian ini adalah bahwa tidak ada algoritma yang secara universal lebih baik, tetapi efektivitasnya bergantung pada karakteristik dataset yang sesuai. Penelitian ini diharapkan dapat memberikan wawasan bagi perusahaan dalam mengoptimalkan strategi bisnis dengan pemahaman yang lebih mendalam terkait karakteristik dataset dan penerapan metode yang efektif.
Item Type: | Thesis (Sarjana) |
---|---|
Identification Number: | 052415 |
Uncontrolled Keywords: | Segmentasi pelanggan, K-Means Clustering, DBSCAN Clustering, Model RFM, Retail apparel, Silhouette Score, Davies-Bouldin Index-Customer segmentation, K-Means Clustering, DBSCAN Clustering, RFM Model, Retail apparel, Silhouette Score, Davies-Bouldin Index |
Divisions: | Fakultas Ilmu Komputer > Sistem Informasi |
Depositing User: | Sugeng Moelyono |
Date Deposited: | 04 Nov 2024 06:32 |
Last Modified: | 04 Nov 2024 06:32 |
URI: | http://repository.ub.ac.id/id/eprint/228028 |
![]() |
Text (DALAM MASA EMBARGO)
Furqan Maulana Pranata.pdf Restricted to Registered users only Download (9MB) |
Actions (login required)
![]() |
View Item |