Pengaruh Penggunaan Phrase Detection Dengan Hidden Markov Model Pos-Tagger Terhadap Akurasi Klasifikasi Sentimen Menggunakan Support Vector Machine

Putranto, HermawanArief (2016) Pengaruh Penggunaan Phrase Detection Dengan Hidden Markov Model Pos-Tagger Terhadap Akurasi Klasifikasi Sentimen Menggunakan Support Vector Machine. Magister thesis, Universitas Brawijaya.

Abstract

Klasifikasi sentimen merupakan salah satu ilmu Pemrosesan Bahasa Alamiah yang bertujuan untuk mengelompokkan dokumen textual berdasarkan sentimen yang terkandung dalam suatu kalimat opini. Bentuk dokumen textual yang cenderung tidak terstruktur menghasilkan banyak atribut saat proses klasifikasi. Hal ini menyebabkan kinerja classifier menjadi berat sehingga akurasinya menurun. Salah satu cara untuk mengurangi jumlah atribut adalah melalui proses filterisasi. Namun, proses filterisasi konvensional ini bisa menyebabkan terhapusnya fitur penting yang dapat mempengaruhi hasil klasifikasi sentimen, khususnya pada dokumen berbahasa Indonesia. Kejadian ini disebabkan karena pada saat proses tokenisasi, kalimat dalam dokumen dipecah menjadi kata tunggal, sehingga apabila ada gabungan kata yang membentuk frasa, komputer tidak akan mengenali frasa tersebut. Hal ini menyebabkan terhapusnya kata dalam kalimat secara otomatis karena kata tersebut juga berada dalam stoplist, walaupun merupakan bagian dari frasa. Solusi yang diajukan dalam penelitian ini adalah proses tokenisasi menggunakan pendekatan berbasis deteksi frasa. Pada pendekatan ini, kalimat tidak langsung dipecah menjadi kata tunggal, melainkan apabila ditemukan dua kata yang membentuk frasa, maka dua kata tersebut akan disimpan sebagai satu entitas. Hasil yang diharapkan dari penggunaan pendekatan berbasis deteksi frasa ini adalah agar komputer mampu mengenali ciri-ciri gabungan dua kata yang berupa frasa dan yang bukan frasa, sehingga komputer secara otomatis dapat membedakan dan kemudian menyimpan frasa tersebut sebagai satu entitas. Dengan demikian, kejadian terhapusnya fitur penting saat proses filterisasi dengan stoplist dapat dihindari, sehingga penggunaan tokenisasi berbasis deteksi frasa ini diharapkan bisa meningkatkan akurasi pada klasifikasi sentimen. Dengan menggunakan HMM POS-Tagger didapatkan peningkatan nilai accuracy pada proses klasifikasi menggunakan Support Vector Machine (SVM) dengan pendekatan berbasis deteksi frasa, lebih kurang sebesar 6% pada Dataset I dan sekitar 3% pada Dataset II dan Dataset III. Hal ini dibuktikan dengan jumlah kalimat dan paragraf yang terklasifikasi dengan benar, sesuai dengan kelas sentimennya, baik pada Dataset I, Dataset II dan pada Dataset III. Perbedaan hasil yang didapatkan dari proses klasifikasi yang menggunakan deteksi frasa pada Dataset I, Dataset II dan Dataset III kemungkinan disebabkan oleh tercampurnya kalimat fakta dan kalimat opini baik pada Dataset II maupun Dataset III. Pada Dataset II kalimat opini tercampur dengan sinopsis atau keterangan tambahan tentang film yang di-review, sedangkan pada Dataset III kalimat opini tercampur dengan kalimat fakta pendukung berita. Selain itu, hasil mesin penterjemah otomatis yang digunakan untuk menterjemahkan review film pada Dataset II kemungkinan juga menyebabkan xvi beberapa atribut tidak penting bisa lolos pada proses filtering. Hal ini menyebabkan banyaknya sisa atribut yang tidak mempengaruhi hasil klasifikasi yang ikut dalam proses klasifikasi, sehingga memberatkan kinerja classifier. Penggunaan kernel linier juga dapat memperbaiki nilai akurasi proses klasifikasi pada dataset dengan dua kelas tujuan. Hal ini ditunjukkan pada saat menggunakan kernel radial basis function, hasil klasifikasi hanya menunjukkan nilai akurasi sebesar 66.67 % pada kedua perlakuan. Hasil ini berbeda jauh dengan yang didapatkan bila menggunakan kernel linier pada Dataset III, yaitu sebesar 90% pada proses klasifikasi dengan menggunakan pendekatan berbasis frasa dan 86,67% pada proses klasifikasi tanpa pendekatan berbasis deteksi frasa.

Item Type: Thesis (Magister)
Identification Number: TES/006.31/PUT/p/2016/041700108
Subjects: 000 Computer science, information and general works > 006 Special computer methods > 006.3 Artificial intelligence
Divisions: S2/S3 > Magister Teknik Elektro, Fakultas Teknik
Depositing User: Nur Cholis
Date Deposited: 14 Jun 2017 09:41
Last Modified: 14 Jun 2017 09:41
URI: http://repository.ub.ac.id/id/eprint/155425
Full text not available from this repository.

Actions (login required)

View Item View Item