Kamal, Attar Syifa and Barlian Henryranu Prasetio, S.T., M.T., Ph.D. (2024) Penerapan Transformasi STFT (Short Time Fourier Transform) Pada Koefisien Frekuensi Mel untuk Mengenali Tipe Vocal Suara. Sarjana thesis, Universitas Brawijaya.
Abstract
Tipe suara vokal merupakan jenis suara yang menjadi tantangan untuk diketahui oleh seorang penyanyi. Tipe suara vokal umumnya terbagi menjadi 4 kelas yakni alto, tenor, bass, dimana proses identifkasi dari setiap kelas umumnya menggunakan piano. Penelitian ini bertujuan untuk membuat alat pengklasifikasi tipe suara vokal yang dapat digunakan dimana saja dan kapan saja. Alat tersebut dirancang dengan menerapkan MFCC (Mel Frequency Cepctral Coeefficient) yang diekstrak melalui penerapan Algoritma STFT (Short Time Fourier Transform) serta diimplementasikan ke dalam Raspbbery Pi 4 Model B. Peneltian menggunakan dataset EsmucChoir yang telah dimodifikasi dengan durasi rekaman selama 3 detik. Setelah berhasil diekstraksi, tahapan klasifikasi untuk setiap kelas dilakukan dengan menggunakan Algoritma CNN (Convolutional Neural Network). Alat nantinya akan dioperasikan dengan menggunakan LCD dan GUI (Graphical User Interface). Hasil penelitian menunujkkan bahwa model CNN berhasil mencapai tingkat akurasi sebesar 97% sementara alat berhasil menunjukkan tingkat akurasi sebesar 65% dari 20 kali percobaan dimana kelas alto mendapatkan akurasi 40%, bass mendapatkan akurasi 100%, tenor mendapatkan akurasi sebesar 60%, dan sopran mendapatkan akurasi sebesar 60% . Alat dan sistem secara keseluruhan bekerja dengan baik sehingga membuka potensi untuk pengembangan lebih lanjut.
English Abstract
The vocal voice type is a challenging aspect for singers to determine. Generally, vocal types are divided into four classes: alto, tenor, bass, and soprano, with the identification process for each class often involving the use of a piano. This research aims to create a vocal voice type classifier that can be used anytime and anywhere. The tool is designed by implementing Mel Frequency Cepstral Coefficients (MFCC), extracted through the Short Time Fourier Transform (STFT) algorithm, and implemented on the Raspberry Pi 4 Model B. The study utilizes the EsmucChoir dataset, modified with 3second recording durations. After successful extraction, the classification stage for each class is performed using a Convolutional Neural Network (CNN) algorithm. The tool will be operated with an LCD and a Graphical User Interface (GUI). The research results show that the CNN model achieved an accuracy rate of 97%, while the tool demonstrated an accuracy rate of 65% from 20 trials. The accuracy rates for each class are as follows: alto 40%, bass 100%, tenor 60%, and soprano 60%. The tool and system as a whole function well, opening the potential for further development.
Item Type: | Thesis (Sarjana) |
---|---|
Identification Number: | 0524150039 |
Uncontrolled Keywords: | Alto, Bass, Tenor, Sopran, STFT, CNN, Raspberry Pi 4 Model B. |
Divisions: | Fakultas Ilmu Komputer > Teknik Komputer |
Depositing User: | Sugeng Moelyono |
Date Deposited: | 16 Feb 2024 06:28 |
Last Modified: | 16 Feb 2024 06:28 |
URI: | http://repository.ub.ac.id/id/eprint/215337 |
![]() |
Text (DALAM MASA EMBARGO)
Attar Syifa Kamal.pdf Restricted to Registered users only Download (3MB) |
Actions (login required)
![]() |
View Item |