Penerapan Klasifikasi Tweets Pada Berita Twitter Menggunakan Metode K-Nearest Neighbor Dan Query Expansion Berbasis Distributional Semantic

Bagaskoro, Galih Nuring (2018) Penerapan Klasifikasi Tweets Pada Berita Twitter Menggunakan Metode K-Nearest Neighbor Dan Query Expansion Berbasis Distributional Semantic. Sarjana thesis, Universitas Brawijaya.

Abstract

Penggunaan teks pendek berbasis digital sampai saat ini masih berkembang dan meluas hingga diberbagai media sosial. Media sosial Twitter memiliki fitur kategori jenis informasi melalui tweets yang di unggah. Setiap pengelompokan jenis informasi dilakukan agar mempermudah pengguna untuk memanfaatkannya. Tujuan dari penggunaan kategori dalam hal ini klasifikasi, untuk meningkatkan kualitas media sosial dalam pengelompokan kategori isi dari konten yang disediakan. Klasifikasi tradisional sampai saat ini masih digunakan, namun hasil yang diperoleh terkadang tidak maksimal, perlu dilakukan ekspansi kata untuk menambahkan kata kedalam teks agar dapat meningkatkan akurasi. Ekspansi kata digunakan dengan berbasis distributional semantic dengan teknik Euclidean distance untuk menemukan kata terdekat dari sumber eksternal agar menjadi kueri yang akan ditambahkan ke teks data uji. Dengan menggunakan data uji 105 dan data latih 400, klasifikasi yang menggunakan K-Nearest Neighbor dapat memperoleh hasil 90% dengan tetangga terdekat K=5. Hasil tersebut sama halnya dengan hasil pengujian yang dilakukan dengan tanpa menggunakan teknik ekspansi kata. Sedangkan pengujian yang dilakukan dengan menambahkan ekspansi kata dengan threshold 0,5 dan nilai tertangga terdekat K-Nearest Neighbor K=5 memperoleh hasil akurasi 92%.

English Abstract

The use of short text based on digital to date is still growing and extending to various social media. Twitter has news features in tweets to represent information representing each type. Each categorization of this type is done to make it easier for users to use it. The purpose of the use of categories in this classification, to evaluate and improve the quality of social media in grouping categories of content of the content provided. Traditional classification is still used today, but the results are sometimes not maximal, it is necessary to expand the word to add words to the text in order to improve the accuracy. Word expansion is used with a semantic-based distributional euclidean distance technique to find the closest word from an external source to be a query to be added to the test data text. Using test data 105 and training data 400, the classification using K-Nearest Neighbor can obtain 90% results with nearest neighbor K=5. These results are similar to the results of tests conducted without using word expansion techniques. While the test is done by adding the expansion of words with threshold 0.5 and the nearest immediate value K-Nearest Neighbor K=5 obtained an accuracy of 92%.

Item Type: Thesis (Sarjana)
Identification Number: SKR/FTIK/2018/139/051801126
Uncontrolled Keywords: Twitter, Tweet, Ekspansi Kata, Distributional Semantic, Euclidean Distance, Klasifikasi, K-Nearest Neighbor
Subjects: 000 Computer science, information and general works > 006 Special computer methods > 006.3 Artificial intelligence > 006.31 Machine learning > 006.312 Data mining
Depositing User: Yusuf Dwi N.
Date Deposited: 28 Jun 2018 02:03
Last Modified: 26 Oct 2021 08:07
URI: http://repository.ub.ac.id/id/eprint/11672
[thumbnail of BAB IV.pdf]
Preview
Text
BAB IV.pdf

Download (1MB) | Preview
[thumbnail of BAB VI.pdf]
Preview
Text
BAB VI.pdf

Download (684kB) | Preview
[thumbnail of DAFTAR PUSTAKA.pdf]
Preview
Text
DAFTAR PUSTAKA.pdf

Download (481kB) | Preview
[thumbnail of BAB VII.pdf]
Preview
Text
BAB VII.pdf

Download (457kB) | Preview
[thumbnail of BAGIAN DEPAN.pdf]
Preview
Text
BAGIAN DEPAN.pdf

Download (2MB) | Preview
[thumbnail of BAB V.pdf]
Preview
Text
BAB V.pdf

Download (931kB) | Preview
[thumbnail of 10. LAMPIRAN.pdf]
Preview
Text
10. LAMPIRAN.pdf

Download (782kB) | Preview
[thumbnail of BAB I.pdf]
Preview
Text
BAB I.pdf

Download (514kB) | Preview
[thumbnail of BAB II.pdf]
Preview
Text
BAB II.pdf

Download (834kB) | Preview
[thumbnail of BAB III.pdf]
Preview
Text
BAB III.pdf

Download (479kB) | Preview

Actions (login required)

View Item View Item