Ekstraksi Informasi Kesehatan Masyarakat Dari Tweet Berbahasa Indonesia Berbasis Klasifikasi Dengan Algoritma Naive Bayes

Main Article Content

Khoirir Rosikin
Setio Basuki
Yufis Azhar

Abstract

Kesehatan merupakan kebutuhan utama manusia. Di Indonesia terdapat  permasalahan tentang kesehatan, yaitu meningkatnya penyakit menular dan penyakit tidak menular. Untuk mengatasinya perlu dilakukan tidakan pencegahan. Salah satu usaha untuk melakukan pencegahan penyakit, adalah dengan mengetahui informasi penyakit tersebut, temasuk tentang penyebab dan akibat yang ditimbulkan, sehingga bisa melakukan pencegahan. Informasi bisa didapatkan dengan berbagai macam cara, salah satunya diambil dari media sosial, terutama twitter. Twitter digunakan karena banyaknya tweet yang dihasilkan sehingga memunculkan fenomena big data. Karena hal itulah, penelitian ini bermaksud untuk melakukan suatu metode ekstraksi informasi. Ekstraksi informasi merupakan metode penerapan data mining terutama bidang text mining yang digunakan untuk mendapatkan informasi dari kumpulan banyak data. Informasi yang dimaksud adalah penyakit, akibat, dan penyebab. Penelitian ini menggunakan pendekatan ekstraksi informasi berbasis klasifikasi dengan algoritma Naive Bayes. Penelitian ini menggunakan 7 set fitur dan sebuah model algoritma klasifikasi yaitu Naive Bayes. Dalam ekstraksi fitur terjadi imbalance dataset, sehingga dilakukan resample filtering data. Pengujian dilakukan dengan 2 metode, yaitu pengujian model dengan menggunakan 10-folds cross-validation dan pengujian klasifikasi dengan menggunakan 100 data uji. Hasil dari pengujian model mendapatkan nilai akurasi 77,27% dan pengujian klasifikasi mendapatkan nilai akurasi 74,07%.

Downloads

Download data is not yet available.

Article Details

How to Cite
[1]
K. Rosikin, S. Basuki, and Y. Azhar, “Ekstraksi Informasi Kesehatan Masyarakat Dari Tweet Berbahasa Indonesia Berbasis Klasifikasi Dengan Algoritma Naive Bayes”, JR, vol. 2, no. 2, Jan. 2024.
Section
Sains Data

References

“6 Masalah Kesehatan Terbesar di Indonesia.” [Online]. Available: https://www.guesehat.com/6-masalah-kesehatan-terbesar-di-indonesia. [Accessed: 25-Mar-2018].

C.-E. A. Winslow, “The Untilled Fields of Public Health,” Science (80-. )., vol. 51, no. 1306, pp. 23–33, 1920.

P. P. Widodo, 16 Penerapan Data Mining Dengan MATLAB. Bandung: Prestasi Pustaka, 2013.

S. Kumar, F. Morstatter, and H. Liu, “Twitter Data Analytics,” Springer, p. 89, 2013.

D. Anggareska and A. Purwarianti, “Information extraction of public complaints on Twitter text for bandung government,” Proc. 2014 Int. Conf. Data Softw. Eng. ICODSE 2014, 2014.

M. L. Khodra, P. Ayu, A. Insanudin, and M. Megally, “Ekstraksi Informasi Transaksi Online pada Twitter,” Cybermatika, vol. 1, no. July, pp. 1–4, 2013.

L. N. Wulansari, “EKSTRAKSI LOKASI DAN PRODUK DARI DATA TRANSAKSI ONLINE PADA TWITTER,” Universitas Muhammadiyah Malang, 2015.

T. R. Hoens and N. V Chawla, “Imbalanced Datasets: From Sampling to Classifiers,” Imbalanced Learn., pp. 43–59, 2013.

T. M. Mitchell, Machine Learning. McGraw-Hill Science/Engineering/Math, 1997.

I. H. Witten, E. Frank, and M. a Hall, Data Mining: Practical Machine Learning Tools and Techniques. 2011.

Most read articles by the same author(s)

1 2 3 4 5 6 7 > >>