Boy Panggabean, Riki and Barlian Henryranu Prasetio, S.T., M.T., Ph.D. (2024) Penerapan Adaptive Framing pada Generator Koefisien Frekuensi Mel untuk Sistem Klasifikasi Tipe Vokal. Sarjana thesis, Universitas Brawijaya.
Abstract
Tipe vokal manusia yang terbagi menjadi Sopran, Alto, Tenor, dan Bass seringkali diidentifikasi melalui interaksi dengan alat musik seperti piano dan bimbingan dari ahli vokal. Namun, pendekatan ini kurang praktis dan memiliki keterbatasan dalam portabilitas serta aksesibilitas. Penelitian ini bertujuan untuk mengatasi keterbatasan tersebut dengan mengembangkan alat berupa sistem portable berbasis teknologi MelFrequency Cepstral Coefficients (MFCC) dan Convolutional Neural Network (CNN). Penelitian ini menggunakan pendekatan Adaptive Framing pada generator koefisien frekuensi MFCC untuk meningkatkan hasil ekstraksi fitur suara. Sistem dibuat di dalam Raspberry Pi 4B dengan input mini usb microphone dan output LCD 3.5 Inch. Sistem ini memenuhi kebutuhan penentuan tipe vokal tanpa ketergantungan pada ahli vokal, memastikan portabilitas tinggi, dan dapat digunakan dalam berbagai konteks. Sistem yang telah dikembangkan menunjukkan kinerja yang baik dari segi fungsionalitas, mulai dari tahap inisialisasi (booting) hingga menghasilkan output klasifikasi tipe vokal manusia pada Raspberry Pi. Nilai akurasi pengujian model dengan menggunakan algoritma CNN adalah sebesar 94,5%. Hal tersebut menandakan model yang dibuat memiliki akurasi yang cukup baik untuk diimplementasikan. Pada pengujian alat, hasil yang didapat untuk melakukan klasifikasi tipe vokal manusia adalah sebesar 65%. Tingkat akurasi dari pengujian alat ini dapat diukur dan dievaluasi secara positif, namun perlu diperhatikan bahwa peningkatan performa masih dapat dicapai dengan melakukan penyesuaian lebih lanjut mulai dari perbaikan dataset maupun perbaikan metode yang dipilih.
English Abstract
Human vocal types, divided into Soprano, Alto, Tenor, and Bass, are often identified through interaction with musical instruments such as the piano and guidance from vocal experts. However, this approach is impractical and has limitations in terms of portability and accessibility. This research aims to overcome these limitations by developing a tool in the form of a portable system based on MelFrequency Cepstral Coefficients (MFCC) technology and Convolutional Neural Network (CNN) on the Raspberry Pi 4B. The research utilizes the Adaptive Framing approach to the MFCC frequency coefficient generator to enhance the extraction of voice feature results. The system is implemented on the Raspberry Pi 4B with a Mini USB Microphone as input and a 3.5 Inch LCD as output. This system meets the need for vocal type determination without dependence on vocal experts, ensuring high portability, and adaptability in various contexts. The developed system demonstrates good performance in terms of functionality, from the initialization stage to producing vocal type classification output on the Raspberry Pi. The accuracy value of the model testing using the CNN algorithm is 94.5%, indicating that the created model has sufficient accuracy for implementation. In tool testing, the obtained result for vocal type classification is 65%. The accuracy level of this tool testing can be measured and evaluated positively, but it should be noted that performance improvement is achievable through further adjustments, starting from dataset enhancements to chosen method improvements.
Item Type: | Thesis (Sarjana) |
---|---|
Identification Number: | 052415 |
Uncontrolled Keywords: | Adaptive Framing, CNN, MFCC, Raspberry Pi, Tipe Vokal, Vocal Types |
Divisions: | Fakultas Ilmu Komputer > Teknik Informatika |
Depositing User: | Annisti Nurul F |
Date Deposited: | 07 Feb 2024 04:20 |
Last Modified: | 07 Feb 2024 04:20 |
URI: | http://repository.ub.ac.id/id/eprint/215842 |
Text (DALAM MASA EMBARGO)
Riki Boy Panggabean.pdf Restricted to Registered users only Download (6MB) |
Actions (login required)
View Item |