Metode Cluster Importance Untuk Peringkasan Dokumen Pada Data Tweet Berbahasa Indonesia (Study Kasus Pilkada Dki Jakarta)

Main Article Content

Dyah Hestiningtyas
Nur Hayatin
Yuda Munarko

Abstract

Pemanfaatan media elektronik sebagai media informasi berkembang sangat pesat di era sekarang. Terbukti meningkatnya jumlah informasi dan data. Banyaknya data yang ada diharapkan dapat memberikan manfaat yang banyak pula. Automatic Text Summarization merupakan salah satu proses peringkasan teks dokumen yang dilakukan secara otomatis melalui mesin komputer. Pada penelitian ini penulis membahas tentang peringkasan dokumen pada tweet, dimana data yang digunakan dengam mengumpulkan tweet melalui web crawler dengan memanfaatkan API TwitterPada paper ini diajukan sebuah metode Cluster Importance dan melakukan pemilihan tweet representatif pada setiap cluster berdasarkan bobot tweet terpenting pada suatu cluster. Yang nantinya bobot tweet  tertinggi dipilih sebagai tweet penyusun ringkasan. Penelitian ini menggunakan 25 topik. hasil dari perhitungan Rouge-N yaitu: Dari 25 topik data uji ada 3topik yang mempunyai Iterasi 1 yaitu topik HUT DKI, Kinerja Djarot, dan Pemimpin dikarenakan jumlah tweet pada topik tersebut sama - sama memiliki 2 tweet. Pengujian perbandingan antara hasil manual dan hasil sistem menunjukan hasil 100% pada topik Dukungan. Perhitungan Rouge-N menyimpulkan bahwa sistem dapat merangkum tweet minimal 3 tweet, dari perbandingan hasil sistem dan manual di dapatkan tweet minimal mempunyai nilai 96% yang di mana sistem bekerja dengan baik, serta pada topik yang memiliki 18 tweet menunjukan hasil 89%.

Downloads

Download data is not yet available.

Article Details

How to Cite
[1]
D. Hestiningtyas, N. Hayatin, and Y. Munarko, “Metode Cluster Importance Untuk Peringkasan Dokumen Pada Data Tweet Berbahasa Indonesia (Study Kasus Pilkada Dki Jakarta)”, JR, vol. 2, no. 6, Jan. 2024.
Section
Articles

References

Annisa, “Peringkasan Tweet Berdasarkan Trending Topic Twitter dengan Pembobotan TF-IDF dan Single Linkage Anggromerative Hierarchical Clustering”, 2016.

OUYANG, Y., Li, W., Zhang, R. , Li, S. & Lu, Q. 2012. A Progressive Sentence Selection Strategy for Document Summarization. Information Processing and Management.

Sarkar, K, “Sentence Clustering-based Summarization of Multiple Text Documents”, TECHNIA – International Journal of Computing Science and Communication Technologies, vol. 2, no. 1, 2009.

Raffi, K. 2013. New Tweets per second record, and how!. Twitter Official Blog. [diakses 6 September 2017]

Blanchette, J. 2008. The little Manual of API Design. Trolltech, a Nokia company.

Sebastian, F. 2002. Machine Learning in automated text categorization. ACM Computing Surveys, Vol. 34, No. 1

Jurafsky and Martin. 2006. Speech and Language Processing, Computational Linguistics, And Speech Recognition 2nd Edition. New Jersey : Pearsin Prentice Hall.

Hovy, E.H. Automated Text Summarization. In R. Mitkov (Ed), Handbook of computation linguistics. Oxford University Press. 2001.

Radev, D. R., Hovy, E.H., & McKeown, K., “Introduction to the Special Issue on Summarization” Computational Linguistics, vol. 28, no. 4, hal. 399-408, 2002. Ferreira, R., Freitas, F., Cabral, L. d. Lins, R. D., Lima, R., Franc. A, G.,...Favaro, L., “A Context Based Text Summarization System”, 11th IAPR

International Workshop on Document Analysis Systems, IEEE. 2014.

Most read articles by the same author(s)

<< < 1 2 3