Metode Cluster Importance Untuk Peringkasan Dokumen Pada Data Tweet Berbahasa Indonesia (Study Kasus Pilkada Dki Jakarta)

Dyah Hestiningtyas; Nur Hayatin; Yuda Munarko

doi:10.22219/repositor.v2i6.30716

PDF

Published: Jan 16, 2024

DOI: https://doi.org/10.22219/repositor.v2i6.30716

Keywords:

Cluster Importance, Twitter, Peringkasan Tweet

Dyah Hestiningtyas

a:1:{s:5:"en_US";s:31:"Universitas Muhammadiyah Malang";}

Nur Hayatin

Yuda Munarko

Abstract

Pemanfaatan media elektronik sebagai media informasi berkembang sangat pesat di era sekarang. Terbukti meningkatnya jumlah informasi dan data. Banyaknya data yang ada diharapkan dapat memberikan manfaat yang banyak pula. Automatic Text Summarization merupakan salah satu proses peringkasan teks dokumen yang dilakukan secara otomatis melalui mesin komputer. Pada penelitian ini penulis membahas tentang peringkasan dokumen pada tweet, dimana data yang digunakan dengam mengumpulkan tweet melalui web crawler dengan memanfaatkan API Twitter. Pada paper ini diajukan sebuah metode Cluster Importance dan melakukan pemilihan tweet representatif pada setiap cluster berdasarkan bobot tweet terpenting pada suatu cluster. Yang nantinya bobot tweet tertinggi dipilih sebagai tweet penyusun ringkasan. Penelitian ini menggunakan 25 topik. hasil dari perhitungan Rouge-N yaitu: Dari 25 topik data uji ada 3topik yang mempunyai Iterasi 1 yaitu topik HUT DKI, Kinerja Djarot, dan Pemimpin dikarenakan jumlah tweet pada topik tersebut sama - sama memiliki 2 tweet. Pengujian perbandingan antara hasil manual dan hasil sistem menunjukan hasil 100% pada topik Dukungan. Perhitungan Rouge-N menyimpulkan bahwa sistem dapat merangkum tweet minimal 3 tweet, dari perbandingan hasil sistem dan manual di dapatkan tweet minimal mempunyai nilai 96% yang di mana sistem bekerja dengan baik, serta pada topik yang memiliki 18 tweet menunjukan hasil 89%.

Downloads

Download data is not yet available.

How to Cite

[1]

D. Hestiningtyas, N. Hayatin, and Y. Munarko, “Metode Cluster Importance Untuk Peringkasan Dokumen Pada Data Tweet Berbahasa Indonesia (Study Kasus Pilkada Dki Jakarta)”, JR, vol. 2, no. 6, Jan. 2024.

Issue

Vol. 2 No. 6 (2020): Juni 2020

Section

Articles

This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.

References

Annisa, “Peringkasan Tweet Berdasarkan Trending Topic Twitter dengan Pembobotan TF-IDF dan Single Linkage Anggromerative Hierarchical Clustering”, 2016.

OUYANG, Y., Li, W., Zhang, R. , Li, S. & Lu, Q. 2012. A Progressive Sentence Selection Strategy for Document Summarization. Information Processing and Management.

Sarkar, K, “Sentence Clustering-based Summarization of Multiple Text Documents”, TECHNIA – International Journal of Computing Science and Communication Technologies, vol. 2, no. 1, 2009.

Raffi, K. 2013. New Tweets per second record, and how!. Twitter Official Blog. [diakses 6 September 2017]

Blanchette, J. 2008. The little Manual of API Design. Trolltech, a Nokia company.

Sebastian, F. 2002. Machine Learning in automated text categorization. ACM Computing Surveys, Vol. 34, No. 1

Jurafsky and Martin. 2006. Speech and Language Processing, Computational Linguistics, And Speech Recognition 2nd Edition. New Jersey : Pearsin Prentice Hall.

Hovy, E.H. Automated Text Summarization. In R. Mitkov (Ed), Handbook of computation linguistics. Oxford University Press. 2001.

Radev, D. R., Hovy, E.H., & McKeown, K., “Introduction to the Special Issue on Summarization” Computational Linguistics, vol. 28, no. 4, hal. 399-408, 2002. Ferreira, R., Freitas, F., Cabral, L. d. Lins, R. D., Lima, R., Franc. A, G.,...Favaro, L., “A Context Based Text Summarization System”, 11th IAPR

International Workshop on Document Analysis Systems, IEEE. 2014.

Article Sidebar

Main Article Content

Abstract

Downloads

Article Details

References

Most read articles by the same author(s)