Klasifikasi Berita Bahasa Indonesia dengan Recurrent Neural Network (RNN)

Muh. Ridha Agam; Christian Sri Kusuma Aditya; Galih Wasis Wicaksono

doi:10.22219/repositor.v7i3.34807

pdf

Published: Sep 1, 2025

DOI: https://doi.org/10.22219/repositor.v7i3.34807

Keywords:

Recurrent Neural Network, Back Translation, Augmentasi Data, Klasifikasi Teks, Klasifikasi Berita

Muh. Ridha Agam

Universitas Muhammadiyah Malang

Christian Sri Kusuma Aditya

Universitas Muhammadiyah Malang

Galih Wasis Wicaksono

Universitas Muhammadiyah Malang

Abstract

Penelitian ini bertujuan untuk mengembangkan model klasifikasi dokumen berita berbahasa Indonesia menggunakan Recurrent Neural Network (RNN). Dengan kemajuan teknologi informasi dalam satu dekade terakhir, media online telah menjadi sumber informasi utama bagi masyarakat, yang mengakibatkan perlunya mekanisme yang efisien untuk mengelola dan mengklasifikasikan konten berita yang terus bertambah setiap hari. Teknologi pembelajaran mesin, khususnya RNN, menjadi sangat penting dalam mengklasifikasikan dokumen berita berbahasa Indonesia karena kemampuannya dalam mempelajari ketergantungan waktu pada data sekuensial. Penelitian ini bertujuan untuk meningkatkan akurasi RNN dengan RNN dan juga melalui augmentasi data. Penelitian ini melibatkan beberapa tahapan utama, yaitu pengumpulan data melalui teknik scraping dari portal berita Kompas.com, preprocessing teks yang mencakup pembersihan, penyaringan, stemming, dan tokenisasi, augmentasi data menggunakan Back Translation, serta pelatihan model RNN. Augmentasi data dilakukan untuk mengatasi ketidakseimbangan kelas dalam dataset dan meningkatkan akurasi model. Hasil penelitian menunjukkan bahwa model RNN yang dilatih dengan augmentasi data menghasilkan peningkatan kinerja yang signifikan dibandingkan dengan metode konvensional seperti Naïve Bayes Classifier. Model RNN tanpa augmentasi mencapai akurasi 92%, sementara model RNN dengan augmentasi data mencapai akurasi 96%. Peningkatan ini juga terlihat pada metrik evaluasi lainnya seperti precision, recall, dan F1-Score

Downloads

Download data is not yet available.

How to Cite

[1]

M. R. Agam, C. S. K. Aditya, and G. W. Wicaksono, “Klasifikasi Berita Bahasa Indonesia dengan Recurrent Neural Network (RNN)”, JR, vol. 7, no. 3, pp. 351–360, Sep. 2025.

Issue

Vol. 7 No. 3 (2025): Agustus 2025

Section

Sains Data

This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.

References

M. J. Denny and A. Spirling, "Text Preprocessing for Unsupervised Learning: Why It Matters, When It Misleads, and What to Do about It," Politycal Analysis, pp. vol. 26, no. 2, 168–189, April 2018.

L. Hickman, S. Thapa, . L. Tay, . M. Cao and P. Srini, "Text Preprocessing for Text Mining in Organizational Research: Review and Recommendations," Organ Res Methods Vol, 25, p. 114–146, January 2022.

C. P. Chai, "Comparison of text preprocessing methods," Nat Lang Eng, vol. 29, p. 509–553, 2023.

Muhammad Ichwan Utari and Henny Medyawati, “CLASSIFICATION OF NEWS TYPES BY IMPLEMENTING ENHANCED CONFIX STRIPPING STEMMER,” International journal of engineering technologies and management research, vol. 6, no. 5, pp. 135–141, Mar. 2020, doi: https://doi.org/10.29121/ijetmr.v6.i5.2019.380

K. Ivanedra and M. Mustikasari, “Implementasi Metode Reccurrent Neural Network pada Text Summarization dengan Teknik Abstraktif,” Jurnal Teknologi Informasi dan Ilmu Komputer, vol. 6, no. 4, p. 377, Jul. 2019, doi: https://doi.org/10.25126/jtiik.2019641067.

D. S.K, in Klasifikasi Berita Menggunakan Algoritma Naive Bayes Classifer Dengan Seleksi Fitur Dan Boosting, 2017.

A. Setiawan, L. W. Santoso, and R. Adipranata, “Klasifikasi Artikel Berita Bahasa Indonesia Dengan Naive Bayes Classifier,” Jurnal Infra, vol. 8, no. 1, pp. 146–151, Apr. 2020.

Iftitah Athiyyah Rahma and Lya Hulliyyatus Suadaa, “Penerapan Text Augmentation untuk Mengatasi Data yang Tidak Seimbang pada Klasifikasi Teks Berbahasa Indonesia,” Jurnal Teknologi Informasi dan Ilmu Komputer/Jurnal teknologi informasi dan ilmu komputer, vol. 10, no. 6, pp. 1329–1340, Dec. 2023.

E. Prasetya and R. Nuraeni, "Deteksi Berita Palsu dengan Pendekatan RNN," Jurnal Keamanan Siber, vol. 4, no. 2, pp. 187-194, 2021.

A. D. Rendragraha, M. A. Bijaksana, and A. Romadhony, "Pendekatan Metode Transformers untuk Deteksi Bahasa Kasar dalam Komentar Berita Online Indonesia," e-Proceeding of Engineering, vol. 8, no. 2, pp. 3385-3395, Apr. 2021.

Article Sidebar

Main Article Content

Abstract

Downloads

Article Details

References

Most read articles by the same author(s)