Klasifikasi Berita Bahasa Indonesia dengan Recurrent Neural Network (RNN)

Main Article Content

Muh. Ridha Agam
Christian Sri Kusuma Aditya
Galih Wasis Wicaksono

Abstract

Penelitian ini bertujuan untuk mengembangkan model klasifikasi dokumen berita berbahasa Indonesia menggunakan Recurrent Neural Network (RNN). Dengan kemajuan teknologi informasi dalam satu dekade terakhir, media online telah menjadi sumber informasi utama bagi masyarakat, yang mengakibatkan perlunya mekanisme yang efisien untuk mengelola dan mengklasifikasikan konten berita yang terus bertambah setiap hari. Teknologi pembelajaran mesin, khususnya RNN, menjadi sangat penting dalam mengklasifikasikan dokumen berita berbahasa Indonesia karena kemampuannya dalam mempelajari ketergantungan waktu pada data sekuensial. Penelitian ini bertujuan untuk meningkatkan akurasi RNN dengan RNN dan juga melalui augmentasi data. Penelitian ini melibatkan beberapa tahapan utama, yaitu pengumpulan data melalui teknik scraping dari portal berita Kompas.com, preprocessing teks yang mencakup pembersihan, penyaringan, stemming, dan tokenisasi, augmentasi data menggunakan Back Translation, serta pelatihan model RNN. Augmentasi data dilakukan untuk mengatasi ketidakseimbangan kelas dalam dataset dan meningkatkan akurasi model. Hasil penelitian menunjukkan bahwa model RNN yang dilatih dengan augmentasi data menghasilkan peningkatan kinerja yang signifikan dibandingkan dengan metode konvensional seperti Naïve Bayes Classifier. Model RNN tanpa augmentasi mencapai akurasi 92%, sementara model RNN dengan augmentasi data mencapai akurasi 96%. Peningkatan ini juga terlihat pada metrik evaluasi lainnya seperti precision, recall, dan F1-Score

Downloads

Download data is not yet available.

Article Details

How to Cite
[1]
M. R. Agam, C. S. K. Aditya, and G. W. Wicaksono, “Klasifikasi Berita Bahasa Indonesia dengan Recurrent Neural Network (RNN)”, JR, vol. 7, no. 3, pp. 351–360, Sep. 2025.
Section
Sains Data

References

M. J. Denny and A. Spirling, "Text Preprocessing for Unsupervised Learning: Why It Matters, When It Misleads, and What to Do about It," Politycal Analysis, pp. vol. 26, no. 2, 168–189, April 2018.

L. Hickman, S. Thapa, . L. Tay, . M. Cao and P. Srini, "Text Preprocessing for Text Mining in Organizational Research: Review and Recommendations," Organ Res Methods Vol, 25, p. 114–146, January 2022.

C. P. Chai, "Comparison of text preprocessing methods," Nat Lang Eng, vol. 29, p. 509–553, 2023.

Muhammad Ichwan Utari and Henny Medyawati, “CLASSIFICATION OF NEWS TYPES BY IMPLEMENTING ENHANCED CONFIX STRIPPING STEMMER,” International journal of engineering technologies and management research, vol. 6, no. 5, pp. 135–141, Mar. 2020, doi: https://doi.org/10.29121/ijetmr.v6.i5.2019.380

K. Ivanedra and M. Mustikasari, “Implementasi Metode Reccurrent Neural Network pada Text Summarization dengan Teknik Abstraktif,” Jurnal Teknologi Informasi dan Ilmu Komputer, vol. 6, no. 4, p. 377, Jul. 2019, doi: https://doi.org/10.25126/jtiik.2019641067.

D. S.K, in Klasifikasi Berita Menggunakan Algoritma Naive Bayes Classifer Dengan Seleksi Fitur Dan Boosting, 2017.

A. Setiawan, L. W. Santoso, and R. Adipranata, “Klasifikasi Artikel Berita Bahasa Indonesia Dengan Naive Bayes Classifier,” Jurnal Infra, vol. 8, no. 1, pp. 146–151, Apr. 2020.

Iftitah Athiyyah Rahma and Lya Hulliyyatus Suadaa, “Penerapan Text Augmentation untuk Mengatasi Data yang Tidak Seimbang pada Klasifikasi Teks Berbahasa Indonesia,” Jurnal Teknologi Informasi dan Ilmu Komputer/Jurnal teknologi informasi dan ilmu komputer, vol. 10, no. 6, pp. 1329–1340, Dec. 2023.

E. Prasetya and R. Nuraeni, "Deteksi Berita Palsu dengan Pendekatan RNN," Jurnal Keamanan Siber, vol. 4, no. 2, pp. 187-194, 2021.

A. D. Rendragraha, M. A. Bijaksana, and A. Romadhony, "Pendekatan Metode Transformers untuk Deteksi Bahasa Kasar dalam Komentar Berita Online Indonesia," e-Proceeding of Engineering, vol. 8, no. 2, pp. 3385-3395, Apr. 2021.

Most read articles by the same author(s)

<< < 1 2 3 4 > >>