Teknik Ekstraksi Katalog Fitur Dari Dokumen Spesifikasi Kebutuhan Sebagai Basis Pengembangan Software Product Lines

Haris, M Syauqi and Tri Astoto Kurniawan, S.T., M.MG.,ph.D and Fatwa Ramdani, S. Si, M.Sc., D.Sc (2020) Teknik Ekstraksi Katalog Fitur Dari Dokumen Spesifikasi Kebutuhan Sebagai Basis Pengembangan Software Product Lines. Sarjana thesis, Universitas Brawijaya.

Abstract

Software Product Line Engineering (SPLE) dengan pendekatan ekstraktif menempatkan fitur perangkat lunak sebagai aspek terpenting dalam domain engineering yang perlu diekstraksi dari artefak sistem yang sudah ada sebelumnya. Fitur dalam SPLE, yang terkait erat dengan fungsionalitas sistem, sebelumnya telah dipelajari untuk diekstraksi dari souce code, model, dan berbagai dokumen teks yang dihasilkan dalam proses pengembangan perangkat lunak. Source code, dengan karakteristik yang ringkas dan baku, telah banyak menjadi focus utama untuk sumber ekstraksi fitur pada penelitian-penelitian sebelumnya. Namun, dalam prinsip rekayasa perangkat lunak, dokumen spesifikasi kebutuhan atau Software Requirement Specification (SRS) adalah dasar atau referensi utama untuk validasi dan verifikasi fungsionalitas sistem. Sementara itu, penelitian sebelumnya tentang ekstraksi fitur dari dokumen spesifikasi kebutuhan hanya dilakukan pada daftar kalimat kebutuhan fungsional yang telah disiapkan sebelumnya, bukan secara harfiah dari dokumen SRS yang utuh. Oleh karena itu, penelitian ini mengusulkan Teknik pemrosesan langsung pada dokumen SRS yang menggunakan requirement boilerplate untuk penulisan setiap kalimat kebutuhan. Metode yang diusulkan adalah pendekatan Natural Language Processing (NLP) pada dokumen SRS. Teknik penandaan Sequence Part-of-Speech (POS) digunakan untuk identifikasi dan ekstraksi kalimat persyaratan otomatis. Fitur kemudian diekstraksi, berdasarkan kalimat kebutuhan yang telah diperoleh sebelumnya, secara otomatis menggunakan teknik word dependency parsing. Selain itu, sebagian besar penelitian sebelumnya tentang ekstraksi fitur menggunakan dokumen SRS yang tidak tersedia untuk umum atau tetap dirahasiakan, sehingga dalam penelitian ini dipilih dokumen dari dataset SRS yang tersedia untuk umum, sebagai nilai tambah penelitian agar dapat direproduksi oleh peneliti lainnya. Hasil akhir dari penelitian ini adalah matriks katalog fitur yang menampilkan peta kesamaan fitur antar produk berdasarkan pendeteksian kesamaan fitur menggunakan Simple Matching Coefficient (SMC) untuk sinonim kata. Penelitian ini membuktikan bahwa ekstraksi kalimat persyaratan langsung dari dokumen SRS bisa dilakukan menggunakan teknik yang diusulkan dengan nilai precision dari 64% hingga 100% dan nilai recall dari 64% menjadi 89%. Sedangkan ekstraksi fitur dari kalimat persyaratan yang diekstraksi memiliki tingkat keberhasilan dari 65% hingga 88%. Adapun pembentukan katalog fitur berdasarkan deteksi kesamaan fitur, diperoleh nilai SMC minimal 0,7 agar fitur yang dibandingkan bisa dianggap sama.

English Abstract

Extractive Software Product Line Engineering (SPLE) puts features on the foremost aspect in domain analysis that needs to be extracted from the existing system's artifact. Feature in SPLE, which is closely related to system functionality, has been previously studied to be extracted from source code, models, and various text documents that exist along the software development process. Source code, with its concise and normative standard, has become the most focus target for feature extraction source on many kinds of research. However, in the software engineering principle, the Software Requirements Specification (SRS) document is the basis or main reference for system functionality conformance. Meanwhile, previous researches of feature extraction from text document are conducted on a list of functional requirement sentences that have been previously prepared, not literally SRS as a whole document. So, this research proposes direct processing on the SRS document that uses requirement boilerplates for requirement sentence statement. The proposed method uses Natural Language Processing (NLP) approach on the SRS document. Sequence Part-of-Speech (POS) tagging technique is used for automatic requirement sentence identification and extraction. The features are acquired afterward from extracted requirement sentences automatically using the word dependency parsing technique. Besides, mostly the previous researches about feature extraction were using non-public available SRS document that remains classified or not accessible, so this work uses selected SRS from publicly available SRS dataset to add reproducible research value. The final result from this experiment is feature catalog matrix displayed shared features between products that is built based on feature similarity using Simple Matching Coefficient (SMC) on word synonym. This research proves that requirement sentence extraction directly from the SRS document is viable with precision value from 64% to 100% and recall value from 64% to 89%. While features extraction from extracted requirement sentences has success rate from 65% to 88%. Finally, feature catalog can be built based on feature similarity with minimum of 0.7 SMC value.

Item Type: Thesis (Sarjana)
Identification Number: 0420150007
Uncontrolled Keywords: Lini Produk Perangkat Lunak, Ekstraksi Fitur, Pemrosesan Bahasa Natural, Software Product Line, Feature Extraction, Natural Language Processing
Subjects: 000 Computer science, information and general works > 004 Computer science
Divisions: S2/S3 > Magister Ilmu Komputer, Fakultas Ilmu Komputer
Depositing User: Budi Wahyono Wahyono
Date Deposited: 12 Jan 2022 06:49
Last Modified: 19 Sep 2024 06:51
URI: http://repository.ub.ac.id/id/eprint/188250
[thumbnail of M Syauqi Haris.pdf]
Preview
Text
M Syauqi Haris.pdf

Download (6MB) | Preview

Actions (login required)

View Item View Item