Klasifikasi Malware Family menggunakan Metode k-Nearest Neighbor (k-NN)
Main Article Content
Abstract
Smartphone berbasis Android OS memiliki pengguna terbanyak saat ini karena nyaman untuk digunakan dan menawarkan berbagai fitur. Akibatnya, banyak developer malware yang menjadikan Android OS sebagai incaran utama. Setiap tahun,bermunculan jenis malware family baru yang belum dikenali. Banyak peneliti mengusulkan kerangka kerja penganalisis malware Android menggunakan teknik data mining untuk mengidentifikasi jenis malware family baru. Para peneliti memerlukan dataset Android inklusif untuk menilai penganalisis Android mereka. Pada tahun 2019, Canadian Institute for Cybersecurity (CIC) telah membuat sebuah dataset untuk umum yang diberi nama CICAndMal2019. Dataset ini dibuat dengan melakukan analisis statis dan dinamis pada smartphone yang sebenarnya. Hasil dari analisis tersebut kemudian dilakukan klasifikasi malware menggunakan matode random forest. Dalam klasifikasi malware family penelitian ini menghasilkan precision sebesar 61,2% dan recall sebesar 57,7%. Pada makalah ini, kami melakukan klasifikasi malware family dengan menggunakan dataset CICAndMal2019 menggunakan metode k-Nearest Neighbor ( k-NN ), hasilnya kami mendapatkan precision sebesar 83% dan recall sebesar 65%.
Downloads
Article Details
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.
References
Rajkumar, M. N., Kumar, V. V., & Vijayabhasker, R. (2020). A Hybrid Approach to Detect the Malicious Applications in Android-Based Smartphones Using Deep Learning. In Handbook of Research on Machine and Deep Learning Applications for Cyber Security (pp. 176-194). IGI Global.
Udayakumar, N., Subbulaksmi, T., Mishra, A., Mishra, S., & Jain, P. (2019). Malware Category Prediction Using KNN and SVM Classifiers. International Journal of Mechanical Engineering and Technology (IJMET) (pp.787-797).
Mahajan, G., Saini, B., & Anand, S. (2019, February). Malware Classification Using Machine Learning Algorithms and Tools. In 2019 Second International Conference on Advanced Computational and Communication Paradigms (ICACCP) (pp. 1-8). IEEE.
Milosevic, N., Dehghantanha, A., & Choo, K. K. R. (2017). Machine learning aided Android malware classification. Computers & Electrical Engineering, 61, 266-274.
San, C. C., Thwin, M. M. S., & Htun, N. L. (2019). Malicious software family classification using machine learning multi-class classifiers. In Computational Science and Technology (pp. 423- 433). Springer, Singapore.
Kruczkowski, M., & Niewiadomska-Szynkiewicz, E. (2014). Comparative study of supervised learning methods for malware analysis. Journal of Telecommunications and Information Technology.
Firdausi, I., Erwin, A., & Nugroho, A. S. (2010, December). Analysis of machine learning techniques used in behavior-based malware detection. In 2010 Second international conference on advances in computing, control, and telecommunication technologies (pp. 201-203). IEEE.
Taheri, L., Kadir, A. F. A., & Lashkari, A. H. (2019, October). Extensible Android Malware Detection and Family Classification Using Network-Flows and API-Calls. In 2019 International Carnahan Conference on Security Technology (ICCST) (pp. 1-8). IEEE.
Chandrasekar, P., & Qian, K. (2016, June). The impact of data preprocessing on the performance of a naive bayes classifier. In 2016 IEEE 40th Annual Computer Software and Applications Conference (COMPSAC) (Vol. 2, pp. 618-619). IEEE.
Kurniawan, E., Nhita, F., Aditsania, A., & Saepudin, D. (2019, July). C5. 0 algorithm and synthetic minority oversampling technique (SMOTE) for rainfall forecasting in Bandung regency. In 2019 7th International Conference on Information and Communication Technology (ICoICT) (pp. 1-5). IEEE
Sandag, G. A., Leopold, J., & Ong, V. F. (2018). Klasifikasi Malicious Websites Menggunakan Algoritma K-NN Berdasarkan Application Layers dan Network Characteristics. CogITo Smart Journal, 4(1), 37-45.
Hackeling, G. (2017). Mastering Machine Learning with scikit-learn. Packt Publishing Ltd.