Perbandingan Metode Klasifikasi Berita Hoaks Berbahasa Indonesia Berbasis Pembelajaran Mesin

Main Article Content

Muhammad Athaillah
Yufis Azhar
Yuda Munarko

Abstract

Klasifiaksi berita hoaks merupakan salah satu aplikasi kategorisasi teks. Berita hoaks harus diklasifikasikan karena berita hoaks dapat mempengaruhi tindakan dan pola pikir pembaca. Dalam proses klasifikasi pada penelitian ini menggunakan beberapa tahapan yaitu praproses, ekstraksi fitur, seleksi fitur dan klasifikasi. Penelitian ini bertujuan membandingkan dua algoritma yaitu algoritma Naïve Bayes dan Multinomial Naïve Bayes, manakah dari kedua algoritma tersebut yang lebih efektif dalam mengklasifikasikan berita hoaks. Data yang digunakan dalam penelitian ini berasal dari www.trunbackhoax.id untuk data berita hoaks sebanyak 100 artikel dan data berita non-hoaks berasal dari kompas.com, detik.com berjumlah 100 artikel. Data latih berjumlah 140 artikel dan data uji berjumlah 60 artikel. Hasil perbandingan algoritma Naïve Bayes memiliki nilai F1-score sebesar 0,93 dan nilai F1-score Multinomial Naïve Bayes sebesar 0,92.

Downloads

Download data is not yet available.

Article Details

How to Cite
[1]
M. Athaillah, Y. Azhar, and Y. Munarko, “Perbandingan Metode Klasifikasi Berita Hoaks Berbahasa Indonesia Berbasis Pembelajaran Mesin”, JR, vol. 2, no. 12, Jan. 2024.
Section
Articles

References

Kementrian Komunikasi dan Informatika Republik Indonesia, “Ada 800.000 Situs Penyebar Hoax di Indonesia,” 2017. .

Kementerian Pendidikan dan Kebudayaan Republik Indonesia, “KBBI Daring,” 2016. .

T. Petković, T. Petković, Z. Kostanjčar, and P. Pale, “E-Mail System for Automatic Hoax Recognition,” 2005.

Y. Y. Chen, S.-P. Yong, and A. Ishak, “Email Hoax Detection System Using Levenshtein Distance Method,” J. Comput., vol. 9, no. 2, pp. 441–446, 2014.

E. Rasywir and A. Purwarianti, “Eksperimen pada Sistem Klasifikasi Berita Hoax Berbahasa Indonesia Berbasis Pembelajaran Mesin,” J. Cybermatika, vol. 3, no. 2, pp. 1–8, 2015.

A. Rahman, “Online News Classification Using Multinomial Naive Bayes,” vol. 6, no. 1, 2017.

R. A. Baeza-Yates and B. Ribeiro-Neto, “Modern Information Retrieval,” vol. 9, 1999.

M. Adriani, J. Asian, B. Nazief, S. M. M. Tahaghoghi, and H. E. Williams, “Stemming Indonesian: A confix-stripping approach,” ACM Trans. Asian Lang. Inf. Process., 2007.

A. Nurfalah and A. Ardiyanti Suryani, “Analisis Sentimen Berbahasa Indonesia Dengan Pendekatan Lexicon-Based Pada Media Sosial,” vol. 2, no. 1, pp. 2541–5093, 2017.

W. C. Indhiarta, “Penggunaan N-Gram Pada Analisa Sentimen,” 2017.

" " C.E. Shannon , vol. 27, pp. , July, October, “A Mathematical Theory of Communication,” Bell Syst. Tech. J., vol. 27, no. April 1928, pp. 379-423,623-656, 1948.

J. R. Quinlan, “Induction of Decision Trees,” Mach. Learn., 1986.

T. M. Mitchell, (Mcgraw-Hill International Edit) Thomas Mitchell-Machine learning-McGraw Hill Higher Education (1997). 1997.

C. D. Manning, Intro to Information Retrieval. 2009.

A. H. Setianingrum, D. H. Kalokasari, and I. M. Shofi, “Implementasi Algoritma Multinomial Naive Bayes Classifier,” J. Tek. Inform., vol. 10, no. 2, pp. 109–118, 2018.

D. D. Lewis and W. A. Gale, “A sequential algorithm for training text classifiers,” in Proceedings of the 17th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, SIGIR 1994, 1994.

Most read articles by the same author(s)

1 2 3 4 5 6 > >>