Adversarial Attack Pada Teks Berbahasa Indonesia Menggunakan Framework TextAttack

Main Article Content

Setio Basuki
Ilham Aulady Miftakhurrizqy

Abstract

Machine learning merupakan sebuah bidang keilmuan yang sangat cepat perkembangannya. Natural language processing atau NLP merupakan salah satu dari beberapa bagian keilmuan machine learning. Perkembangan NLP yang cepat ini juga telah diimplementasikan pada keseharian manusia, seperti chatbot, search engine, analisa sentiment, dan lain-lain. Perkembangan ini juga diikuti dengan adanya resiko seperti adversarial attack. Adversarial attack merupakan serangan yang bertujuan untuk menipu model machine learning, termasuk NLP. Adversarial attack pada NLP dilakukan dengan mengubah data yang akan diproses oleh model, sehingga model bisa terkelabuhi saat mengeluarkan output. Proses adversarial attack pada NLP tersebut bisa dipermudah dengan mengguanakan sebuah framework TextAttack. Penelitian ini bertujuan untuk melakukan perbandingan pada model NLP dengan karakteristik aristektur yang berbeda dan melihat bagaimana adversarial attack bisa mempengaruhi model NLP tersebut. Proses penelitian ini memiliki beberapa tahap, yaitu mencari dataset, preprocessing, pembuatan 3 model NLP, pengubahan resep pada framework, dan evaluasi model saat sebelum diserang serta sesudah diserang. Model yang digunakan pada penelitian ini merupakan model Multinomial Naïve Bayes dengan arsitektur klasik, model dengan arsitektur LSTM, dan model dengan arsitektur BERT. Hasil penelitian menunjukkan jika model arsitektur BERT memiliki ketahanan yang lebih baik dari pada model klasik dan model LSTM. Sedangkan model klasik memberikan hasil serangan yang paling sedikit daripada model LSTM dan model BERT. Penelitian ini diharapkan dapat memberikan kontribusi dalam bidang adversarial attack khususnya pada teks yang berbahasa Indonesia.

Downloads

Download data is not yet available.

Article Details

How to Cite
[1]
S. Basuki and I. A. Miftakhurrizqy, “Adversarial Attack Pada Teks Berbahasa Indonesia Menggunakan Framework TextAttack”, JR, vol. 7, no. 2, pp. 157–168, May 2025.
Section
Sains Data

References

[1] A. C. Müller dan S. Guido, Introduction to Machine Learning with Python A GUIDE FOR DATA SCIENTISTS Introduction to Machine Learning with Python, 1 ed. Sebastopol: O’Reilly Media, Inc., 2016.

[2] A. Vaswani dkk., “Attention Is All You Need,” dalam 31st Conference on Neural Information Processing Systems, Long Beach, Jun 2017. [Daring]. Tersedia pada: http://arxiv.org/abs/1706.03762

[3] X. Luo, H. Ding, M. Tang, P. Gandhi, Z. Zhang, dan Z. He, “Attention Mechanism with BERT for Content Annotation and Categorization of Pregnancy-Related Questions on a Community QA Site,” dalam Proceedings - 2020 IEEE International Conference on Bioinformatics and Biomedicine, BIBM 2020, Institute of Electrical and Electronics Engineers Inc., Des 2020, hlm. 1077–1081. doi: 10.1109/BIBM49941.2020.9313379.

[4] J. Devlin, M.-W. Chang, K. Lee, dan K. Toutanova, “BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding,” dalam Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, Volume 1 (Long and Short Papers), J. Burstein, C. Doran, dan T. Solorio, Ed., Minneapolis, Minnesota: Association for Computational Linguistics, Jun 2019, hlm. 4171–4186. doi: 10.18653/v1/N19-1423.

[5] J. X. Morris, E. Lifland, J. Y. Yoo, J. Grigsby, D. Jin, dan Y. Qi, “TextAttack: A Framework for Adversarial Attacks, Data Augmentation, and Adversarial Training in NLP,” 2020. [Daring]. Tersedia pada: https://arxiv.org/abs/2005.05909

[6] S. Ren, Y. Deng, K. He, dan W. Che, “Generating Natural Language Adversarial Examples through Probability Weighted Word Saliency,” dalam Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics, Florence: Association for Computational Linguistics, Jul 2019, hlm. 1085–1097. [Daring]. Tersedia pada: https://wordnet.princeton.edu/

[7] L. Li, R. Ma, Q. Guo, X. Xue, dan X. Qiu, “BERT-ATTACK: Adversarial Attack Against BERT Using BERT,” dalam Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing (EMNLP), B. Webber, T. Cohn, Y. He, dan Y. Liu, Ed., Online: Association for Computational Linguistics, Nov 2020, hlm. 6193–6202. doi: 10.18653/v1/2020.emnlp-main.500.

[8] D. Jin, Z. Jin, J. T. Zhou, dan P. Szolovits, “Is BERT Really Robust? A Strong Baseline for Natural Language Attack on Text Classification and Entailment,” dalam The Thirty-Fourth AAAI Conference on Artificial Intelligence, Jul 2019, hlm. 8018–8025. Diakses: 21 Januari 2025. [Daring]. Tersedia pada: https://ojs.aaai.org/index.php/AAAI/article/view/6311/6167

[9] J. Li, S. Ji, T. Du, B. Li, dan T. Wang, “TEXTBUGGER: Generating Adversarial Text Against Real-world Applications,” dalam 26th Annual Network and Distributed System Security Symposium, NDSS 2019, San Diego: The Internet Society, Feb 2019. doi: 10.14722/ndss.2019.23138.

[10] D. Jurafsky dan J. H. Martin, Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition with Language Models, 3rd ed. 2025. [Daring]. Tersedia pada: https://web.stanford.edu/~jurafsky/slp3/