Menilai Kelayakan dan Keakuratan Aturan Mining yang Dihasilkan Algoritma Genetika

Arta Kusuma, Indra (2009) Menilai Kelayakan dan Keakuratan Aturan Mining yang Dihasilkan Algoritma Genetika. Sarjana thesis, Universitas Brawijaya.

Abstract

Telah terjadi pertumbuhan data yang sangat besar pada segala bidang. Realitanya, hanya sedikit data yang akan digunakan karena ukuran datanya yang terlalu besar dan terlalu kompleks untuk diolah. Padahal kebutuhan untuk menggali informasi yang tersembunyi pada data adalah sangat penting. Data Mining bertujuan menggali informasi yang akurat dan lengkap dari database yang besar. Klasifikasi adalah salah satu metode Data Mining yang menghasilkan aturan dari database . Dalam banyak penelitian tentang klasifikasi, hanya berkisar pada pencarian keakuratan aturan yang terukur dengan tingkat kesalahan klasifikasi. Maka pada skripsi ini, penekanannya adalah menilai kelayakan sekaligus keakuratan aturan IF-THEN . Pada sistem, Algoritma Genetika mengimplementasikan teknikbklasifikasi aturan dengan pembangkitan populasi awal secara terstruktur dan perhitungan nilai fitness berparameter kelayakan antecedentconsequent dan keakuratan prediksi untuk menghasilkan aturan IFTHEN dengan atribut tujuan tertentu. Tahapan awal akan dilakukan pengkondisian data-contoh sesuai tipe masukan dari Algoritma Genetika. Tahapan pengkondisian data ini terdiri dari pengisian nilai hilang dan pendiskritan nilai kontinu. Pada tahapan kedua akan dilakukan operasi genetika untuk mencari aturan serta menghitung nilai kelayakan dan keakuratannya dari data-contoh. Pengujian pada sistem dilakukan untuk mengetahui pengaruh parameter jumlah populasi terhadap nilai kelayakan antecedent ( AI ) , nilai kelayakan consequent ( CI ), nilai keakuratan prediksi ( PA ), dan nilai Fitness . Dan untuk mengetahui pengaruh parameter persentase data-latih dan persentase data-uji terhadap nilai persentase kebenaran aturan dari data-uji ( PC ). Hasil dari penelitian ini yakni kenaikan nilai parameter jumlah populasi mempengaruhi tingginya nilai kelayakan antecedent ( AI ) dari aturan dengan nilai AI paling maksimal=0,99 pada jumlah populasi ke-80. Perubahan nilai parameter jumlah populasi tidak mempengaruhi nilai kelayakan consequent ( CI ) dari aturan. Begitu juga perubahan nilai persentase data-latih tidak mempengaruhi perubahan nilai kelayakan CI . Kenaikan nilai parameter jumlah populasi mempengaruhi tingginya nilai prediksi keakuratan ( PA ) dari suatu aturan dengan nilai PA paling maksimal=0,96 pada jumlah populasi ke-60 sampai ke-80. Kenaikan nilai parameter jumlah populasi mempengaruhi tingginya nilai fitness dari aturan, dengan nilai fitness paling maksimal =0,93 pada jumlah populasi ke-70. Pada data-contoh Crx , kenaikan nilai parameter jumlah populasi menghasilkan rendahnya nilai persentase kebenaran aturan dari data-uji ( PC ). Hal ini disebabkan adanya nilai hilang, nilai kontinu, dan atribut berisi sebaran banyak nilai; sedang yang paling besar pengaruhnya terhadap rendahnya nilai PC pada data-contoh Crx yakni atribut berisi sebaran banyak nilai. Kenaikan nilai persentase data-uji mempengaruhi terhadap tingginya nilai persentase kebenaran aturan dari data-uji ( PC ) , terutama pada posisi persentase data-uji 100% dengan nilai PC =11,02.

Item Type: Thesis (Sarjana)
Identification Number: SKR/FP/2009/107/050901270
Subjects: 500 Natural sciences and mathematics > 510 Mathematics
Divisions: Fakultas Matematika dan Ilmu Pengetahuan Alam > Matematika
Depositing User: Unnamed user with email repository.ub@ub.ac.id
Date Deposited: 06 May 2009 10:41
Last Modified: 08 Apr 2022 07:50
URI: http://repository.ub.ac.id/id/eprint/128098
[thumbnail of 050901270.pdf]
Preview
Text
050901270.pdf

Download (2MB) | Preview

Actions (login required)

View Item View Item