Implementation of Naïve-Bayes Algorithm for Spell Correction in Web-Based Learning for Written English

Damegi, AbdalhkimAM (2012) Implementation of Naïve-Bayes Algorithm for Spell Correction in Web-Based Learning for Written English. Magister thesis, Universitas Brawijaya.

Abstract

Bahasa Inggris telah mengakui sebagai bahasa kedua dan sebagai penghalang bahasa yang berbeda di seluruh negara. Untuk belajar bahasa Inggris dapat dibagi menjadi dua jenis bahasa Inggris, bahasa Inggris lisan dan tulisan bahasa Inggris, keduanya penting. Belajar bahasa Inggris relatif lebih mudah untuk dikembangkan karena teknologi untuk memproses input teks relatif lebih mudah daripada memproses input bicara. Dengan kemampuan aplikasi web telah memperbesar kemungkinan pengembangan aplikasi dan memudahkan penggunaannya. Aplikasi ini akan membantu siswa dalam menulis bahasa Inggris dan memberikan umpan balik sebagai hasil praktik mereka. Aplikasi ini akan dapat memberikan saran tentang ejaan yang benar sehingga siswa dapat memahami kesalahan dalam praktik mereka secara tertulis dalam bahasa Inggris. Aplikasi ini memerlukan proses pelatihan dengan memasukkan teks yang berisi penggunaan kata-kata bahasa Inggris yang benar dan setiap hari, seperti dari novel atau artikel, bukan dari kamus. Proses pelatihan ini adalah membuat `kamus` dalam database, dengan setiap kata memiliki probabilitas dan frekuensi penggunaannya berdasarkan proses pelatihan. Menggunakan Algoritma Naïve Bayes Setiap bahasa Inggris tertulis diperiksa dan menghasilkan persentase dari kata-kata yang benar dan salah, jika ada kata yang salah, aplikasi akan menunjukkan kata yang benar, dan kata-kata saran lainnya jika tersedia. Hasil untuk setiap kata atau kalimat yang dimasukkan adalah saran dan skor yang mewakili persentase kata yang benar dan salah. Saran dapat mengakibatkan bervariasi, tergantung pada apa yang dapat ditemukan dalam kamus, menurut semua kata yang dihasilkan (dari kata yang salah) sebagai hasil dari manipulasi kata dan memeriksa masing-masing dalam kamus. Saran null terjadi jika kata yang ditulis oleh pengguna tidak memiliki saran dari kamus, saran tunggal terjadi jika saran dari kamus hanya satu, lebih dari satu saran muncul jika kamus berisi banyak saran, sarannya adalah diperintahkan secara ketat sesuai dengan nilai probabilitas, dan yang digarisbawahi sebagai kata probabilitas tertinggi.

English Abstract

English has been acknowledging as the second language and as the barrier of different language across the nations. To learn English language can be divided into two kinds of English, oral English and written English, both are important. Learning written English is relatively easier to develop because of the technology to process text input is relatively easier than to process speech input. With the capability of web application has enlarge the possibility of the application development and ease the use of it . This application will help students in writing English and provide feedback as the results of their practice. This application will be able to give advice about the correct spelling so that students can understand the mistakes in their practice in writing in English. This application require a training process by inputting text that contains of correct and daily use of English words, such as from novels or articles, not from dictionary. This training process is to create a ‘dictionary` in database, with each word have their probability and frequency of use based on the training process. Using Naïve Bayes algorithm any written English is checked and result in percentage of any correct and incorrect words, if there are incorrect words the application will show the correct word, and other suggestion words if available. Result for every word(s) or sentence inserted are suggestion(s) and the score that represents the percentage of correct and incorrect words. Suggestion may result in vary, depending on what can be found in dictionary, according to all generated word (from incorrect word) as the result of word manipulation and checking each of it in dictionary. Null suggestion occur if the word(s) written by the user doesn`t have any suggestion from dictionary, single suggestion occur if the suggestion from dictionary is only one, more than one suggestion appear if the dictionary contains of many suggestion, the suggestions is ordered descendingly according to probability value, and the underlined one as the highest probability word.

Item Type: Thesis (Magister)
Identification Number: TES/006.7/DAM/i/041200034
Subjects: 000 Computer science, information and general works > 006 Special computer methods > 006.7 Multimedia systems
Divisions: S2/S3 > Magister Teknik Elektro, Fakultas Teknik
Depositing User: Endro Setyobudi
Date Deposited: 16 Jul 2012 11:08
Last Modified: 16 Jul 2012 11:08
URI: http://repository.ub.ac.id/id/eprint/155449
Full text not available from this repository.

Actions (login required)

View Item View Item