Peringkasan Multi Dokumen Berita Dengan Pemilihan Kalimat Utama Berbasis Algoritma Cluster Importance Dengan Mempertimbangkan Posisi Kalimat

Syadza Anggraini; Nur Hayatin; Gita Indah Marthasari

doi:10.22219/repositor.v2i1.31529

PDF

Published: Jan 2, 2024

DOI: https://doi.org/10.22219/repositor.v2i1.31529

Keywords:

Peringkasan Teks, Berita, Redundansi, Cluster Importance, Posisi Kalimat

Syadza Anggraini

a:1:{s:5:"en_US";s:2:"SA";}

Nur Hayatin

Universitas Muhammadiyah Malang

Gita Indah Marthasari

Universitas Muhammadiyah Malang

Abstract

Peringkasan teks merupakan salah satu cara untuk mengurangi suatu dimensi dokumen yang besar untuk mendapatkan informasi penting dari dokumen tersebut. Berita adalah salah satu informasi yang biasanya dalam satu topik memiliki beberapa sub topik. Untuk dapat mengambil informasi penting dari satu topik secara cepat, peringkasan multi dokumen berita dapat menjadi solusi. Namun, peringkasan multi dokumen dapat menimbulkan redundansi. Oleh sebab itu, penelitian ini menerapkan algoritma cluster importance dengan mempertimbangkan posisi kalimat untuk mengatasi redundansi tersebut. Penelitian ini menggunakan 30 topik berita berbahasa Indonesia, dimana tiap topiknya terdiri dari 5 sub topik berita. Dari 30 topik berita yang diuji menggunakan Rouge-1, dimana terdapat 2 topik berita yang memiliki nilai Rouge-1 berbeda antara yang menggunakan algoritma cluster importance ditambah posisi kalimat dengan yang hanya menggunakan algoritma cluster. Namun dari 2 topik berita tersebut, nilai Rouge-1 yang menggunakan cluster importance ditambah posisi kalimat memiliki nilai yang lebih besar daripada yang hanya menggunakan cluster importance. Penggunaan posisi kalimat memiliki pengaruh terhadap urutan bobot kalimat pada setiap topiknya, namun hanya 2 topik berita yang berpengaruh terhadap hasil ringkasan.

Downloads

Download data is not yet available.

How to Cite

[1]

S. Anggraini, N. Hayatin, and G. I. Marthasari, “Peringkasan Multi Dokumen Berita Dengan Pemilihan Kalimat Utama Berbasis Algoritma Cluster Importance Dengan Mempertimbangkan Posisi Kalimat”, JR, vol. 2, no. 1, Jan. 2024.

Issue

Vol. 2 No. 1 (2020): Januari 2020

Section

Pengembangan Perangkat Lunak

This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.

References

W. E. Waliprana and M. L. Khodra, “Update Summarization Untuk Kumpulan Dokumen Berbahasa Indonesia,” J. Cybermatika, pp. 6–10, 2009.

N. Munot and S. S. Govilkar, “Comparative Study of Text Summarization Methods,” Int. J. Comput. Appl., vol. 102, no. 12, pp. 975–8887, 2014.

A. Agrawal and U. Gupta, “Extraction Based Approach for Text Summarization Using K-means Clustering,” Int. J. Sci. Res. Publ., vol. 4, no. 11, pp. 9–12, 2014.

F. H. Evan, Y. S. Purnomo, and Pranowo, “Pembangunan Perangkat Lunak Peringkas Dokumen Dari Banyak Sumber Menggunakan Sentence Scoring Dengan Metode Tf-Idf,” Semin. Nas. Apl. Teknol. Inf., pp. 17–22, 2014.

K. Sarkar, “Sentence Clustering-Based Summarization of Multiple Text Documents,” Tech. – Int. J. Comput. Sci. Commun. Technol., vol. 2, no. 1, pp. 974–3375, 2009.

N. Hayatin, C. Fatichah, and D. Purwitasari, “Pembobotan Kalimat Berdasarkan Fitur Berita dan Trending Issue Untuk Peringkasan Multi Dokumen Berita,” J. Ilm. Teknol. Inf., vol. 13, pp. 38–44, 2015.

F. Z. Tala, “A Study of Stemming Effects on Information Retrieval in Bahasa Indonesia,” 2003.

E. Purwanti, “Klasifikasi Dokumen Temu Kembali Informasi dengan K-Nearest Neghbour Information Retrieval Document Classified with K-Nearest Neighbor,” Rec. Libr. J., vol. 1, pp. 187–196, 2015.

Annisa, Y. Munarko, and Y. Azhar, “Peringkasan Tweet Berdasarkan Trending Topic Twitter Dengan Pembobotan TF-IDF dan,” J. Kinet., vol. 1, no. 1, pp. 9–16, 2016.

J. P. Mei and L. Chen, “SumCR: A New Subtopic-Based Extractive Approach for Text Summarization,” Knowl. Inf. Syst., vol. 31, no. 3, pp. 527–545, 2012.

S. Verdianto, A. Z. Arifin, and D. Purwitasari, “Strategi Pemilihan Kalimat Pada Peringkasan Multi Dokumen,” J. Tek. ITS, vol. 2, no. 7, pp. 1–5, 2016.

C. Y. Lin, “Rouge: A Package for Automatic Evaluation of Summaries,” Proc. Work. Text Summ. Brances Out Assoc. Comput. Linguist. Barcelona, no. 1, pp. 25–26, 2004.

Article Sidebar

Main Article Content

Abstract

Downloads

Article Details

References

Most read articles by the same author(s)