Klasifikasi Tweets Tindak Kejahatan Berbahasa Indonesia Menggunakan Naive Bayes

Main Article Content

Siti Maghfiroh
Setio Basuki
Yufis Azhar

Abstract

Kasus tindak kejahatan konvensional seperti penganiayaan, penculikan, pencurian, dll masih jarang digunakan sebagai objek penelitian. Kasus kejahatan yang biasa diteliti hanya pada lingkup kejahatan cyber seperti pembajakan software, carding, penipuan online, dll. Maka dalam penelitian ini penulis mengangkat kasus kejahatan konvensional sebagai objek penelitian. Penulis mencoba mendapatkan informasi kejahatan dari media sosial, Twitter. Dari Twitter didapatkan data berupa cuitan para pengguna yang mengandung unsur kejahatan. Selanjutnya, akan dilakukan klasifikasi untuk menentukan mana di antara data tersebut yang benar-benar mengandung informasi kejahatan, dan bukan merupakan sebuah opini. Metode yang digunakan dalam pengklasifikasian data adalah algoritma Naive Bayes Classifier dengan 2 jenis dataset. Dataset pertama berisi fitur lexical atau bag of words dan dataset kedua berisi fitur sintaktik. Penulis menggunakan 2 dataset untuk membandingkan kinerja dari kedua fitur dalam proses klasifikasi data tweets. Rata-rata hasil akurasi model klasifikasi menggunakan fitur sintaktik adalah sebesar 88,1398% sedangkan pada fitur lexical atau bag of words sebesar 79,25%. Kemudian dari hasil klasifikasi, penulis mendapatkan lokasi di mana tindak kejahatan tersebut terjadi menggunakan metode Named Entity Recognition (NER). Dari proses NER tersebut, maka didapatkan hasil akurasi sebesar 65%.

Downloads

Download data is not yet available.

Article Details

How to Cite
[1]
S. Maghfiroh, S. Basuki, and Y. Azhar, “Klasifikasi Tweets Tindak Kejahatan Berbahasa Indonesia Menggunakan Naive Bayes”, JR, vol. 2, no. 7, Jan. 2024.
Section
Articles

References

D. B. Prasetyo, “Sistem Informasi Geografis Berbasis Google Maps API Untuk Pemetaan Profil Kriminalitas Tipe Konvensional Di Wilayah Hukum Polresta Yogyakarta,” 2014.

S. Rodiyansyah and E. Winarko, “Klasifikasi Posting Twitter Kemacetan Lalu Lintas Kota Bandung Menggunakan Naive Bayesian Classification,” Indones. J. Comput. Cybern. Syst., vol. 6, no. 1, pp. 91–100, 2012.

L. Jayanti, S. R. Sentinuwo, O. A. Lantang, and A. Jacobus, “Analisa Pola Penyalahgunaan Facebook Sebagai Alat Kejahatan Trafficking Menggunakan Data Mining,” vol. 8, no. 1, pp. 2301–8364, 2016.

B. Loni, “Enhanced Question Classification with Optimal Combination of Features: A New Approach on Automated Question Answering Systems,” Pattern Recognit., 2012.

Y. Ganisaputra and R. Tan, “Naïve Bayes Classifier,” pp. 173–188.

A. Purwarianti, A. Andhika, A. F. Wicaksono, I. Afif, and F. Ferdian, “InaNLP: Indonesia natural language processing toolkit, case study: Complaint tweet classification,” 4th IGNITE Conf. 2016 Int. Conf. Adv. Informatics Concepts, Theory Appl. ICAICTA 2016, no. August, 2016.

D. A. N. K. Com, “MENGGUNAKAN TWITTER STUDI KASUS DETIK . COM,” p. 2015, 2015.

A. Darmawan, “Aplikasi Pengklasifikasian Dokumen Info Pada Twitter Menggunakan Algoritma Naive Bayes,” Malang, 2014.

K. Makhtidi, “SISTEM SMS SPAM DETECTOR UNTUK SMS BERBAHASA INDONESIA PADA SMARTPHONE ANDROID,” 2012

E. Prasetyo, Data Mining-Konsep dan Aplikasi Menggunakan MATLAB. Yogyakarta: ANDI, 2012.

S. D. Prihadi, “Berapa Jumlah Pengguna Facebook dan Twitter di Indonesia?,” 2015. [Online]. Available: https://www.cnnindonesia.com/teknologi/20150327061134-185-42245/berapa-jumlah-pengguna-facebook-dan-twitter-di-indonesia/. [Accessed: 03-Oct-2016].

Most read articles by the same author(s)

<< < 2 3 4 5 6 7