Alwi, Avisena Abdillah and Putra Pandu Adikara, S.Kom., M.Kom. and Indriati, S.T., M.Kom. (2020) Pengenalan Jenis Kelamin dan Rentang Umur Berdasarkan Suara Menggunakan Metode Backpropagation Neural Network. Sarjana thesis, Universitas Brawijaya.
Abstract
Teknologi di bidang speech recognition saat ini mengalami kemajuan pesat. Salah satu teknologi yang memanfaatkan speech recognition adalah asisten virtual seperti Google Asisten, Cortana, dan Alexa. Guna meningkatkan kualitas komunikasi antara asisten virtual dan manusia, asisten virtual perlu mengenal siapa lawan komunikasinya. Salah satu caranya adalah dengan mengetahui jenis kelamin dan umurnya. Pengenalan jenis kelamin dan rentang umur berdasarkan suaranya merupakan salah satu bagian speech recognition. Dari audio tidak bisa langsung diklasifikasikan oleh karena itu perlu adanya ekstraksi ciri atau fitur, ekstraksi fitur yang dapat digunakan antara lain Mel-Spectogram, Mel Frequency Cepstral Coefficients (MFCC), dan Chroma- Short-Time Fourier Transform. Arsitektur jaringan saraf tiruan mampu mengklasifikasikan hal tersebut, salah satu metodenya adalah Backpropagation. Dari pengujian yang dilakukan klasifikasi jenis kelamin dan rentang umur dengan dataset dari Mozilla Common Voice mendapatkan akurasi yang kurang baik yaitu 0,18357. Dari hasil pengujian tersebut perlu untuk dilakukan pengujian tambahan yaitu pengujian dataset. Ketika dilakukan pengujian dataset untuk klasifikasi jenis kelamin saja terlihat akurasi klasifikasi dengan dataset Mozilla Common Voice sebesar 0,62504 sedangkan akurasi dari klasifikasi dengan dataset dari Free ST American English Corpus mendapat 0,9349. Dari pengujian yang dilakukan disimpulkan bahwa penggunaan dataset Mozilla Common Voice kurang direkomendasikan untuk pengenalan jenis kelamin dan/atau rentang umur.
English Abstract
Technology in the field of speech recognition is currently experiencing rapid progress. One technology that utilizes speech recognition is virtual assistants such as Google Assistant, Cortana, and Alexa. In order to improve the quality of communication between virtual assistants and humans, virtual assistants need to know who their communication opponents are. One way is by knowing the gender and age. Recognition of gender and age range based on voice is one part of speech recognition. Audio cannot be directly classified, therefore there is a need for feature or feature extraction, feature extraction that can be used include Mel- Spectogram, Mel Frequency Cepstral Coefficients (MFCC), and Chroma- Short-Time Fourier Transform. Artificial neural network architecture is able to classify it, one of the methods is Backpropagation. From the tests conducted by gender classification and age range with a dataset from Mozilla Common Voice, the accuracy is less good, that is 0.18357. From the test results it is necessary to do additional testing, namely testing the dataset. When testing the dataset for gender classification alone, the accuracy of classification with the Mozilla Common Voice dataset is 0.62504, while the accuracy of the classification with the dataset from Free ST American English Corpus gets 0.9349. From the tests conducted it was concluded that the use of the Mozilla Common Voice dataset was less recommended for gender and / or age recognition.
Other obstract
-
Item Type: | Thesis (Sarjana) |
---|---|
Identification Number: | 0520150067 |
Uncontrolled Keywords: | Speech Recognition, jenis kelamin, umur, Backpropagation, Mel- Spectogram, MFCC, Chroma-STFT Speech Recognition, gender, age, Backpropagation, Mel-Spectogram, MFCC, Chroma-STFT |
Subjects: | 000 Computer science, information and general works > 006 Special computer methods > 006.3 Artificial intelligence > 006.32 Neural nets (neural networks) |
Divisions: | Fakultas Ilmu Komputer > Teknik Informatika |
Depositing User: | Budi Wahyono Wahyono |
Date Deposited: | 28 Feb 2021 15:14 |
Last Modified: | 30 Aug 2024 07:30 |
URI: | http://repository.ub.ac.id/id/eprint/183641 |
Text (DALAM MASA EMBARGO)
Avisena Abdillah Alwi.pdf Restricted to Registered users only Download (3MB) |
Actions (login required)
View Item |