Peringkasan Multi Dokumen Berita Dengan Pemilihan Kalimat Utama Berbasis Algoritma Cluster Importance Dengan Mempertimbangkan Posisi Kalimat
Main Article Content
Abstract
Peringkasan teks merupakan salah satu cara untuk mengurangi suatu dimensi dokumen yang besar untuk mendapatkan informasi penting dari dokumen tersebut. Berita adalah salah satu informasi yang biasanya dalam satu topik memiliki beberapa sub topik. Untuk dapat mengambil informasi penting dari satu topik secara cepat, peringkasan multi dokumen berita dapat menjadi solusi. Namun, peringkasan multi dokumen dapat menimbulkan redundansi. Oleh sebab itu, penelitian ini menerapkan algoritma cluster importance dengan mempertimbangkan posisi kalimat untuk mengatasi redundansi tersebut. Penelitian ini menggunakan 30 topik berita berbahasa Indonesia, dimana tiap topiknya terdiri dari 5 sub topik berita. Dari 30 topik berita yang diuji menggunakan Rouge-1, dimana terdapat 2 topik berita yang memiliki nilai Rouge-1 berbeda antara yang menggunakan algoritma cluster importance ditambah posisi kalimat dengan yang hanya menggunakan algoritma cluster. Namun dari 2 topik berita tersebut, nilai Rouge-1 yang menggunakan cluster importance ditambah posisi kalimat memiliki nilai yang lebih besar daripada yang hanya menggunakan cluster importance. Penggunaan posisi kalimat memiliki pengaruh terhadap urutan bobot kalimat pada setiap topiknya, namun hanya 2 topik berita yang berpengaruh terhadap hasil ringkasan.
Downloads
Article Details
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.
References
W. E. Waliprana and M. L. Khodra, “Update Summarization Untuk Kumpulan Dokumen Berbahasa Indonesia,” J. Cybermatika, pp. 6–10, 2009.
N. Munot and S. S. Govilkar, “Comparative Study of Text Summarization Methods,” Int. J. Comput. Appl., vol. 102, no. 12, pp. 975–8887, 2014.
A. Agrawal and U. Gupta, “Extraction Based Approach for Text Summarization Using K-means Clustering,” Int. J. Sci. Res. Publ., vol. 4, no. 11, pp. 9–12, 2014.
F. H. Evan, Y. S. Purnomo, and Pranowo, “Pembangunan Perangkat Lunak Peringkas Dokumen Dari Banyak Sumber Menggunakan Sentence Scoring Dengan Metode Tf-Idf,” Semin. Nas. Apl. Teknol. Inf., pp. 17–22, 2014.
K. Sarkar, “Sentence Clustering-Based Summarization of Multiple Text Documents,” Tech. – Int. J. Comput. Sci. Commun. Technol., vol. 2, no. 1, pp. 974–3375, 2009.
N. Hayatin, C. Fatichah, and D. Purwitasari, “Pembobotan Kalimat Berdasarkan Fitur Berita dan Trending Issue Untuk Peringkasan Multi Dokumen Berita,” J. Ilm. Teknol. Inf., vol. 13, pp. 38–44, 2015.
F. Z. Tala, “A Study of Stemming Effects on Information Retrieval in Bahasa Indonesia,” 2003.
E. Purwanti, “Klasifikasi Dokumen Temu Kembali Informasi dengan K-Nearest Neghbour Information Retrieval Document Classified with K-Nearest Neighbor,” Rec. Libr. J., vol. 1, pp. 187–196, 2015.
Annisa, Y. Munarko, and Y. Azhar, “Peringkasan Tweet Berdasarkan Trending Topic Twitter Dengan Pembobotan TF-IDF dan,” J. Kinet., vol. 1, no. 1, pp. 9–16, 2016.
J. P. Mei and L. Chen, “SumCR: A New Subtopic-Based Extractive Approach for Text Summarization,” Knowl. Inf. Syst., vol. 31, no. 3, pp. 527–545, 2012.
S. Verdianto, A. Z. Arifin, and D. Purwitasari, “Strategi Pemilihan Kalimat Pada Peringkasan Multi Dokumen,” J. Tek. ITS, vol. 2, no. 7, pp. 1–5, 2016.
C. Y. Lin, “Rouge: A Package for Automatic Evaluation of Summaries,” Proc. Work. Text Summ. Brances Out Assoc. Comput. Linguist. Barcelona, no. 1, pp. 25–26, 2004.