OPTIMASI TEKNIK KLASIFIKASI MODIFIED K NEAREST NEIGHBOR MENGGUNAKAN ALGORITMA GENETIKA
Main Article Content
Abstract
OPTIMASI TEKNIK KLASIFIKASI MODIFIED K NEAREST NEIGHBOR MENGGUNAKAN ALGORITMA GENETIKA
Optimization Techniques Modified K Nearest Neighbor Classification Using Genetic Algorithm
Siti Mutrofin, Abidatul Izzah, Arrie Kurniawardhani, Mukhamad Masrur
Jurusan Sistem Informasi, Fakultas Teknik, Unipdu, Kompleks Ponpes Darul ‘Ulum Peterongan Jombang, 61481
ABSTRACT
One of the tasks of data mining is classifi cation, many researchers are already conducting research on the method of classification. Classification method used is k-Nearest Neighbor (kNN). kNN has several advantages, including the training is fast, simple and easy to learn, resistant to the training data that has noise, and effectively if the large training data. Meanwhile, the lack of kNN is the value of k bias, complex computing, memory limitations, and easily fooled by irrelevant attributes. One improvement is the Modifi ed kNN kNN (MKNN), which aims to improve the accuracy of the kNN, by adding the calculation of validity.
because it is considered the weight calculations contained in kNN, have problems outlier. However, MKNN also have the same disadvantages as kNN k value bias and complex computing. Based on the MKNN problems, the author intends to make improvements in terms of, optimization Genentic value k using Algorithm (GA), because GA has proven it can be used to optimize the value of k for kNN. Furthermore, the algorithm will be called GMKNN algorithm (Genetic Modifi ed k Nearest Neighbor). Evaluation level of truth results will be based on the value of accuracy, either using kNN algorithm, MKNN and GMKNN use data UCI machine
learning.
Keywords : kNN , Modified kNN , Genetic Algorithm , Genetic Modified kNN, UCI Machine Learning
ABSTRAK
Salah satu tugas dari data mining adalah klasifikasi, banyak peneliti yang sudah melakukan penelitian tentang metode klasifikasi. Metode klasifikasi yang biasa digunakan adalah k-Nearest Neighbor (kNN). kNN memiliki beberapa kelebihan, diantaranya adalah pelatihan sangat cepat, sederhana dan mudah dipelajari, tahan terhadap data pelatihan yang memiliki derau, dan efektif jika data pelatihan besar. Sedangkan, kekurangan dari kNN adalah nilai k bias, komputasi kompleks, keterbatasan memori, dan mudah tertipu dengan atribut yang tidak relevan. Salah satu perbaikan kNN adalah Modifi ed kNN (MKNN), yang bertujuan untuk meningkatkan akurasi dari kNN, dengan menambahkan perhitungan validity, karena dianggap perhitungan bobot yang terdapat pada kNN, memiliki permasalahan outlier. Namun, MKNN juga memiliki kelemahan yang sama dengan kNN yaitu nilai k bias dan komputasi yang kompleks. Berdasarkan permasalahan MKNN tersebut, penulis bermaksud untuk melakukan perbaikan dalam hal, optimasi nilai k menggunakan Genentic Algorithm (GA), karena GA sudah terbukti dapat digunakan untuk melakukan optimasi pada nilai k untuk
kNN. Selanjutnya algoritma tersebut akan dinamakan algoritma GMKNN (Genetic Modifi ed k Nearest Neighbor). Evaluasi tingkat kebenaran hasil akan didasarkan pada nilai akurasi, baik menggunakan algoritma kNN, MKNN maupun GMKNN menggunakan data UCI machine learning.
Kata Kunci : kebijakan publik, Supiory, daerah tertinggal dan pengembangan