Seleksi Fitur Information Gain Untuk Klasifikasi Informasi Tempat Tinggal Di Kota Malang Berdasarkan Tweet Menggunakan Metode Naïve Bayes Dan Pembobotan TF-IDF-CF

Irsad, Ahmad Efriza (2019) Seleksi Fitur Information Gain Untuk Klasifikasi Informasi Tempat Tinggal Di Kota Malang Berdasarkan Tweet Menggunakan Metode Naïve Bayes Dan Pembobotan TF-IDF-CF. Sarjana thesis, Universitas Brawijaya.

Abstract

Kota malang merupakan kota yang memiliki peningkatan jumlah penduduk yang bisa dibilang cukup pesat, yaitu sekitar 50 ribu jiwa dalam jangka waktu 5 tahun. Salah satu penyebabnya dikarenakan kota Malang merupakan salah satu kota pendidikan karena di kota ini terdapat banyak perguruan tinggi yang cukup banyak dan bisa dibilang cukup populer, seperti Universitas Brawijaya (UB), Universitas Islam Malang (Unisma), dll. Hal ini membuat banyak pendatang dari luar daerah kota Malang berkuliah di kota malang, ada beberapa hal yang mungkin menjadi alasan pendatang memilih kota Malang, salah satunya karena kota Malang memiliki universitas dengan kualitas yang bisa dibilang salah satu yang terbaik di Inonesia. Ketika menjadi seorang migran tentu yang dibutuhkan adalah tempat tinggal dalam jangka waktu yang panjang, karena itu para pendatang tadi tentu memerlukan informasi tempat tinggal berupa kost atau kontrakan untuk ditinggali, informasi tentang tempat tinggal ini dapat kita dapatkan melalui media sosial seperti Twitter, namun di Twitter masih belum ada pengelompokkan mengenai informasi-informasi seperti ini. Melihat masalah ini maka digunakan Teknik klasifikasi untuk mengelompokkan informasi berupa tempat tinggal yang ada di kota malang. Pada penelitian ini digunakan metode Naïve Bayes sebagai metode pengklasifikasian dan metode Information Gain untuk menyeleksi fitur yang digunakan. Sebelum masuk kedalam proses pengklasifikasian dilakukan pembobotan terlebih dahulu menggunakan metode TF-IDF-CF. Data yang digunakan sebagai data latih sebanyak 150 data, sedangkan 60 data untuk data uji. Hasil akurasi terbaik yang didapatkan dari penelitian ini adalah sebesar 71,66% dengan menggunakan fitur sebanyak 33%, pembobotan TF-IDF-CF, dan tanpa penggunaan fitur angka.

English Abstract

Malang city is a city that has a significant increase in population, which is around 50 thousands people in just period of 5 years. One of the reasons is because Malang city is a city of education, the reasons its called city of education is because in this City there are a lot of public university and private university that are quite popular, such as Universitas Brawijaya (UB), Universitas Islam Malang (Unisma), etc. This resulted many migrants from outside the area of Malang city study in Malang city. There are some things that might be the reasons why migrants choose Malang city, such as the Malang city have one of the best quality university in Indonesia. When becoming a migrant, the most needed thing is certainly a place to live in a long term, because of that the migrants need information on where to live in the form of boarding house or rent house to live in, we can get this kind of information trough social media like Twitter, but on Twitter there is still no category for this kind of information. By seeing this problem, we can use Classification technique to classified the information in the form of living quarters in the city of Malang. In this study Naïve Bayes method is used as the classification method, and Information gain as the feature selection method. Before entering the classification process the weighting is done first using TF-IDF-CF method. This study uses 150 training data and 60 testing data. The highest accuracy value in this study are 71,66% using 33% of feature, using TF-IDF-ICF weighthing and, without using number feature.

Item Type: Thesis (Sarjana)
Identification Number: SKR/FILKOM/2019/38/051902208
Uncontrolled Keywords: kost, kontrakkan, Twitter, Naïve Bayes, Information Gain, TF-IDF-CF-boarding house, rent house, Naïve Bayes, Information Gain, TF-IDF-CF
Subjects: 000 Computer science, information and general works > 001 Knowledge > 001.012 Classification
Divisions: Fakultas Ilmu Komputer > Teknik Informatika
Depositing User: soegeng sugeng
Date Deposited: 01 Aug 2020 04:50
Last Modified: 19 Oct 2021 09:17
URI: http://repository.ub.ac.id/id/eprint/168873
[thumbnail of Ahmad Efriza Irsad.pdf]
Preview
Text
Ahmad Efriza Irsad.pdf

Download (1MB) | Preview

Actions (login required)

View Item View Item