Aloysius Darin Ario and Barlian Henryranu Prasetio, S.T., M.T., Ph.D. (2024) Penerapan Optimisasi Pruning Dan Clustering Tensorflow Lite Pada Embedded System Untuk Sistem Speech To Text. Sarjana thesis, Universitas Brawijaya.
Abstract
Komunikasi verbal adalah kunci dalam menyampaikan informasi melalui suara. Di era digital, kemampuan komputer untuk memahami ucapan manusia melalui teknologi speech to text menjadi semakin penting. Teknologi ini memungkinkan perangkat mengenali dan mengubah suara menjadi teks, dan telah diterapkan dalam berbagai aplikasi seperti asisten virtual dan sistem navigasi berbasis suara. Embedded systems menawarkan peluang besar untuk mengintegrasikan teknologi ini ke dalam perangkat kecil, andal, hemat daya, dan portabel. Namun, tantangan utama adalah keterbatasan komputasi dan penyimpanan. Penelitian ini mengusulkan solusi dengan menggunakan TensorFlow Lite, versi ringan dari TensorFlow, untuk mengoptimalkan model machine learning pada perangkat dengan sumber daya terbatas. Model yang digunakan dilatih dengan metode Mel-Frequency Cepstral Coefficients (MFCC) untuk ekstraksi ciri dan Convolutional Neural Network (CNN) untuk klasifikasi. Fokus penelitian ini adalah penerapan TensorFlow Lite yang dioptimalkan menggunakan Pruning dan Clustering pada sistem embedded untuk sistem speech to text, dengan tujuan menciptakan sistem yang efektif dan efisien. Hasil penelitian menunjukkan bahwa penggunaan TensorFlow Lite dapat mengatasi tantangan tersebut, memberikan kinerja yang optimal meskipun dengan keterbatasan perangkat keras. Penggunaan TensorFlow Lite mengurangi waktu inference sebesar 93.3% dan penggunaan memori RAM sebesar 17.1% dibangingkan dengan model yang tidak dioptimisasi. Evaluasi kinerja model menghasilkan nilai akurasi 0.97, presisi 0.994, recall 0.997, dan F1-score 0.997
English Abstract
Verbal communication is key to conveying information through voice. In the digital age, the ability of computers to understand human speech through speech-to-text technology has become increasingly important. This technology enables devices to recognize and convert voice into text and has been applied in various applications such as virtual assistants and voice-based navigation systems. Embedded systems offer significant opportunities to integrate this technology into small, reliable, power-efficient, and portable devices. However, the main challenge is computational and storage limitations. This research proposes a solution using TensorFlow Lite, a lightweight version of TensorFlow, to optimize machine learning models on resource-constrained devices. The model utilized is trained with Mel-Frequency Cepstral Coefficients (MFCC) for feature extraction and Convolutional Neural Networks (CNN) for classification. The focus of this study is the application of optimized TensorFlow Lite using Pruning and Clustering on embedded systems for speech-to-text systems, aiming to create an effective and efficient system. The results indicate that TensorFlow Lite can address these challenges, providing optimal performance despite hardware limitations. TensorFlow Lite reduces inference time by 93.3% and RAM usage by 17.1% compared to non-optimized models. Model performance evaluation yields an accuracy of 0.97, precision of 0.994, recall of 0.997, and an F1-score of 0.997
Item Type: | Thesis (Sarjana) |
---|---|
Identification Number: | 052415 |
Uncontrolled Keywords: | Speech to Text, Embedded System, TensorFlow Lite, MFCC, CNN, Pruning, Clustering-Speech to Text, Embedded System, TensorFlow Lite, MFCC, CNN, Pruning, Clustering |
Divisions: | Fakultas Ilmu Komputer > Sistem Informasi |
Depositing User: | Sugeng Moelyono |
Date Deposited: | 06 Nov 2024 02:15 |
Last Modified: | 06 Nov 2024 02:15 |
URI: | http://repository.ub.ac.id/id/eprint/228225 |
![]() |
Text (DALAM MASA EMBARGO)
Aloysius Darin Ario.pdf Restricted to Registered users only Download (6MB) |
Actions (login required)
![]() |
View Item |