Kombinasi Metode Interest Point Dalam Proses Segmentasi Dan City_Block Dalam Proses Pengenalan Huruf Hijaiyyah Pada Tulisan Cetak Arab Bersambung

Qomariyah, Fitriyatul (2017) Kombinasi Metode Interest Point Dalam Proses Segmentasi Dan City_Block Dalam Proses Pengenalan Huruf Hijaiyyah Pada Tulisan Cetak Arab Bersambung. Magister thesis, Universitas Brawijaya.

Abstract

Huruf Arab disebut juga sebagai Huruf Hijaiyyah yang terdiri dari 29 huruf. Huruf Arab memiliki keunikan tersendiri dibandingkan huruf lainnya. Keunikan tersebut diantaranya bentuk huruf dan cara bacanya yang jauh berbeda dibandingkan huruf-huruf lainnya. Bentuk Huruf Arab terbagi menjadi 4 yaitu ketika berada di awal kata, tengah kata, akhir kata, dan ketika huruf tersebut berdiri sendiri (isolated). Untuk mengenali setiap Huruf Arab dalam suatu kata atau kalimat yang tersambung terlebih dahulu kita harus memisah setiap karakter atau hurufnya. Pemisahan Huruf Arab yang tersambung merupakan bagian yang sulit di bidang Computer Vision. Masalah terbesar dalam proses segmentasi tulisan arab yang tersambung adalah memecah setiap karakter dengan posisi dan ukuran setiap karakter yang berbeda. Pada penelitian ini, interest point digunakan sebagai acuan pemotongan huruf dalam proses segmentasi. Interest point dibangun dengan 9 Rules persimpangan yang telah ditentukan. Data yang digunakan dalam penelitian ini adalah Surah Al-Fatihah dengan font Arial, Times New Roman, dan Courier New ukuran 72 pt. Dari hasil yang didapatkan dari proses segmentasi, sistem mendapatkan tingkat akurasi 92.31% untuk font Arial, 92.17% untuk font Times New Roman, dan 78.92% untuk font Courier New. Setelah setiap huruf terpisah, proses selanjutnya adalah pengenalan. Proses pengenalan dalam penelitian ini menggunakan metode city_block dengan pengambilan fitur (ekstraksi fitur) menggunakan kombinasi fitur, kemudian metode pengenalan kedua menggunakan Learning Vector Quantization (LVQ). Dari kedua metode pengenalan tersebut, hasilnya dibandingkan untuk mengetahui metode manakah yang lebih baik. Dari hasil yang didapat, metode city_block dengan pengambilan fitur (ekstraksi fitur) menggunakan kombinasi fitur 1 menghasilkan tingkat akurasi sebesar 82.7% untuk Arial dan 77.50% untuk Times New Roman dengan kesamaan fitur 70%, Dan akurasi yang diperoleh dari metode City_Block menggunakan Feature Combination 2 untuk font Arial, Times New Roman, Courier New secara berturut-turut yaitu sebesar 32.24%, 32.50%, dan 20.65% untuk kesamaan fitur 70%, sedangkan untuk metode Learning Vector Quantization (LVQ) menghasilkan tingkat akurasi sebesar 9.27% untuk font Arial, 8.75% untuk font Times New Roman, dan 7.65% untuk font Courier New.

English Abstract

Arabic character also called as hijayyah letters which consist of 29 letters. The letter has its own uniqueness compared to other letters. The uniqueness of Arabic letter is its forms and the way to read it. Arabic letter character has 4 different forms at the beginning, middle, ending, and isolated. For the recognition process of arabic character, at first, we have to separate each character. The image segmentation is the crucial part in Computer vision. The biggest problem in segmentation process used connected arabic letters is to separate each letter with a different size and shape. In this study, interest point is used as a reference to separate each connected arabic letter. Interest point use 9 intersection rules specified. The data used in this study is Surah Al-Fatihah with Arial, Times New Roman, and Courier New font size 72 pt. From the result of segmentation process, the system gets the accuracy of 92.31% for Arial, 92.17% for Times New Roman, and 78.92% for font Courier New. After the segmentation process, the next process is the recognition process. The recognition process in this study is using City_Block method with feature combination and Learning Vector Quantization (LVQ). From these method both, the result will be compared to find out the best method. The result, City_Block method with feature combination 1 get the accuracy of 82.7% for Arial and 77.50% for Times New Roman with 70% of similarity features, and get the accuracy of 32.24% for Arial, 32.50% for Times New Roman, dan 20.65% for courier new for City_Block method with feature combination 2 with 70% of similarity features, and for Learning Vector Quantization (LVQ), the accuracy is 9.27% for Arial, 8.75% for Times New Roman, and 7.65% for Courier New.

Item Type: Thesis (Magister)
Identification Number: TES/006.4/QOR/k/2017/041706581
Uncontrolled Keywords: PATTERN RECOGNITION SYSTEMS, COMPUTER VISION, CITY BLOCKD, ARABIC LANGUAGE - WORD FORMATION
Subjects: 000 Computer science, information and general works > 005 Computer programming, programs, data > 005.1 Programming > 005.13 Programming languages > 005.133 Specific programming languages
Divisions: S2/S3 > Magister Ilmu Komputer, Fakultas Ilmu Komputer
Depositing User: Nur Cholis
Date Deposited: 14 Aug 2017 03:44
Last Modified: 25 Nov 2020 07:09
URI: http://repository.ub.ac.id/id/eprint/1241
[thumbnail of Qomariyah, Fitriyatul.pdf]
Preview
Text
Qomariyah, Fitriyatul.pdf

Download (7MB) | Preview

Actions (login required)

View Item View Item