Kategori, fungsi, dan peran sintaksis bahasa Indonesia dengan PoS Tagging berbasis rule dan probability
DOI:
https://doi.org/10.22219/kembara.v8i1.18602Keywords:
Fungsi, Kategori, PoS tagging, Probability, RuleAbstract
Penelitian ini dilatarbelakangi oleh kekurangan basis data gramatikal kategori khususnya pada verba yang belum lengkap yang menduduki fungsi predikat kopulatif, ekuatif, dan eksistensial dan belum adanya data Pos Tagging peran semantik agen dan pasien pada bahasa Indonesia. Diharapkan hasil penelitian ini dapat memprediksi kategori, fungsi, dan peran secara secara keseluruhan pada tiap kalimat. Penentuan kategori dilakukan dengan pembangunan model probability-based PoS Tagging, dan menghasilkan akurasi sebesar 92,53% dengan penambahan khusus tag verba (kopulatif, ekuatif, dan eksistensial) yang dapat menduduki posisi predikat dengan. Sementara itu, penentuan fungsi dan peran dilakukan dengan metode rule-based, yakni dengan pembuatan algoritma. Hasil akhir dari penelitian ini adalah kalimat baru dari The corpus ind_mixed_2013 Leipzig Corpora yang telah ditentukan kategori, fungsi, dan perannya untuk masing-masing kata. Pada penentuan peran agen, kedudukan agen pada kalimat yang diprediksi secara benar adalah sebanyak 82,58% dengan row label N dan PRON yang menduduki posisi agen bertipe nominative akusatif aktif, sedangkan pada peran pasien pada kalimat yang diprediksi secara benar adalah sebanyak 9,68% dengan row label N dan PRON dengan tipe pasif, ergative, dan anti-pasif. Temuan baru dalam penelitian ini adalah komponen verba (kopulatif, ekuatif dan eksistensial) yang dapat menduduki posisi predikat dalam secara fungsional dan potensi adanya tipologi ergative dengan diatesis ergative dan anti-pasif setelah diterapkan rule dan probability based dengan Pos Tagging.
Downloads
References
Alwi, H. et al. (2003). Tata bahasa baku bahasa Indonesia: Edisi Ketiga. Jakarta: Balai Pustaka.
Ambiya, M. Z. (2018). Keberlakuan nomina sebagai predikat dalam kalimat bahasa Indonesia: Kajian sintaksis (Noun Existence as predicate in sentence of Indonesian language: A study on syntax). Ranah: Jurnal Kajian Bahasa, 7(1), 49-68. https://doi.org/10.26499/rnh.v7i1.543
Antonio, S. (2017). A tentative corpus-based approach to English ergative verbs. July. https://doi.org/10.13140/RG.2.2.12120.19208
Arka, I. W. (2018). Lexical-functional grammar: Some of its basic principles and its challenge in its application to the languages of Indonesia. Pertemuan Linguistik Pusat Kajian Bahasa dan Budaya Atma Jaya 16. Jakarta: Yayasan Obor Indonesia.
Artawa, K. (2020). Pemarkahan diatesis bahasa Indonesia. Mozaik Humaniora, 20(1), 26-?. https://doi.org/10.20473/mozaik.v20i1.15128
Carina Silberer, M. P. (2018). Grounding semantic roles in images. In B. Brussels (Ed.), Proceedings of the 2018 Conference on Empirical Methods in Natural Language Processing (pp. 2616–2626). Association for Computational Linguistics. https://doi.org/10.18653/v1/D18-1282
Carroll, J. (2013). The Routledge handbook of corpus linguistics. London: Routledge.
Cholisi, F. (2013). A lexical-functional grammar representation. Jurnal Sosial Humaniora. 6(1), 46-61. https://doi.org/10.12962/j24433527.v6i1.610
Comrie, B. (1981). Language universals and linguistics typology. New Jersey: Basil Blackwell.
Coon, J., & Abenina-Adar, M. (2013). Ergativity in linguistics. Oxford: Oxford University Press.
Dewi, N. P., & Ubaidi, U. (2020). PoS tagging bahasa Madura dengan menggunakan algoritma Brill Tagger. Jurnal Teknologi Informasi dan Ilmu Komputer, 7(6), 1121-1128. https://doi.org/10.25126/jtiik.2020722449
Dixon, R. M. (1994). Ergativity. Cambridge: Cambridge University Press.
Effendi, D. E., & Muchammadun. (2018). “Happiness” in bahasa Indonesia and its implication to health and community well-being. Asian EFL Journal, 20(8), 279-291.
Falk, Y. (2011). Lexical-functional grammar. Oxford: Oxford University Press.
Gunawan, D., Amalia, A., & Maringga, O. N. (2019). Building the Application to identify incorrect capital letters writing in bahasa Indonesia. Journal of Physics: Conference Series, 1235(1), 1-7. https://doi.org/10.1088/1742-6596/1235/1/012108
Jia, J. K., Shao, Y. bin, Long, H., & Du, Q. Z. (2020). A natural language sentence analysis algorithm based on word order modifier syntax rules. Procedia Computer Science, 166, 496–500. https://doi.org/10.1016/j.procs.2020.02.058
Jufrizal, J. (2008). Tipologi linguistik: Dasar kerangka teori dan arah kajiannya. Linguistika, 1(3), 23-35. Retrieved from http://jurnalvivid.fib.unand.ac.id/index.php/lingkul/index
Jurafsky, D., Martin, J, H. (2000). Speech and language processing. Britain: Prentice Hall.
Kridalaksana, H. (1988). Beberapa prinsip perpaduan leksem dalam bahasa Indonesia. Jakarta: Kanisius.
Kridalaksana, H. (2008). Kamus linguistik edisi keempat. Jakarta: Gramedia Pustaka Utama.
Mallinson, G. dan B. J. B. (1981). Language typology: Cross-linguistic studies in syntax. North-Holland Publishing Company.
Mughni, M. B. M. Y. (2021). Perbandingan kata kerja tak akusatif dengan kata kerja tak ergatif bahasa Melayu: Analisis Aktionsart. Jurnal Linguistik, 24(1). 19-32. doi: 10.31604/linguistik.v3i1.19-38
Musgrave, S. (2013). Functional categories in the syntax and semantics of Malay. NUSA: Linguistic Studies of Languages in and around Indonesia, 55, 135–152. Retrieved from http://repository.tufs.ac.jp/bitstream/10108/74330/2/nusa5509.pdf
Pramudita, H. R., Utami, E., & Amborowati, A. (2016). Pengaruh part of speech tagging berbasis aturan dan distribusi probabilitas maximum entropy untuk bahasa Jawa Krama. Jurnal Buana Informatika, 7(4), 10-25. https://doi.org/10.24002/jbi.v7i4.764
Pye, C. (1990). The acquisition of ergative languages. Linguistics, 28(6), 1291-1330. https://doi.org/10.1515/ling.1990.28.6.1291
Rajeg, G. P. W., Denistia, K., & Rajeg, I. M. (2019). Working with a linguistic corpus using r: An introductory note with Indonesian negating construction. Linguistik Indonesia, 36(1), 1–36. https://doi.org/10.26499/li.v36i1.71
Ramlan. (1987). Ilmu bahasa Indonesia, sintaksis. Yogyakarta: CV Karyono.
Rober, D. Van Valin, Jr. R. J. L. (2001). Syntax: Structure, meaning and Fuction. Cambridge: Cambridge University Press.
Satriya, S., & Wisnu, T. (2016). Pasif periferal: Struktur ergatif dalam bahasa Indonesia. Metalingua. 14(2), 233–242. http://dx.doi.org/10.26499/metalingua.v14i2.199
Sherly, Novita, M. (2019). Pembentukan verba ergatif dalam bahasa Hokkien: Kajian morfosintaksis. 26(1), 8-17. https://doi.org/ttps://doi.org/10.24843/ling.2019.v26.i01.p02.
Sneddon, J. N., Adelaar, A., Djenar, D. N., & Ewing, M. C. (2010). Indonesian Reference Grammar. Oxford: Allen & Unwin.
Song, J. J. (2014). Linguistic typology (1st Edition). Britain: Oxford University Press.
Syahroni, Abd. Wahab, H. (2019). Aplikasi penentuan kategori dan fungsi sintaksis kalimat bahasa Indonesia. InfoTekJar: Jurnal Nasional Informatika dan Teknologi Jaringan, 1(3), 13-20 https://doi.org/https://doi.org/10.30743/infotekjar.v4i1.1537
Tallerman, M. (2014). Understanding syntax. (Fourth Edition). New York: Routledge.
Tallerman, M. (2015). Understanding syntax (Fourth edi). New York: Routledge.
Verhaar, J. W., & Alip, B. (1996). Asas-asas linguistik umum. Yogyakarta: Gadjah Mada University Press.
Widhiyanti, K., & Harjoko, A. (2013a). PoS tagging bahasa Indonesia dengan HMM dan rule based. Jurnal Informatika, 8(2), 151-167. https://doi.org/10.21460/inf.2012.82.125
Yazid, A. S., & Fatwanto, A. (2018). Penentuan kelas kata pada part of speech tagging kata ambigu bahasa Indonesia. JISKA (Jurnal Informatika Sunan Kalijaga), 2(3), 157-166. https://doi.org/10.14421/jiska.2018.23-05
Yuki, L. K. (2021). Study of the meaning of lelaki, bujang and bujangan words in the utilisation of Indonesian corpus. Jurnal Sasindo UNPAM, 9(1).81-93 https://doi.org/10.32493/sasindo.v9i1.81-93
Yusuf, K., & Puspita, D. (2020). Diachronic corpora as a tool for tracing etymological information of Indonesian-Malay Lexicon. Register Journal, 13(1), 153-182. https://doi.org/10.18326/rgt.v13i1.153-182
Downloads
Published
How to Cite
Issue
Section
License
This work is licensed under a Creative Commons Attribution 4.0 International License.
Authors who publish with The KEMBARA: Jurnal Keilmuan Bahasa, Sastra, dan Pengajarannya (e-Journal) agree to the following terms:
Articles are published under the Creative Commons Attribution 3.0 Unported License (CC-BY 3.0).
Under the CC-BY license, authors retain ownership of the copyright for their article, but authors grant others permission to use the content of publications in KEMBARA: Jurnal Keilmuan Bahasa, Sastra, dan Pengajarannya (e-Journal) in whole or in part provided that the original work is properly cited. Users (redistributors) of KEMBARA: Jurnal Keilmuan Bahasa, Sastra, dan Pengajarannya are required to cite the original source, including the author's names, KEMBARA: Jurnal Keilmuan Bahasa, Sastra, dan Pengajarannya (e-Journal) as the initial source of publication, year of publication, volume number and DOI (if available).
Authors may publish the manuscript in any other journal or medium but any such subsequent publication must include a notice that the manuscript was initially published by KEMBARA: Jurnal Keilmuan Bahasa, Sastra, dan Pengajarannya (e-Journal).
Authors grant KEMBARA: Jurnal Keilmuan Bahasa, Sastra, dan Pengajarannya (e-Journal) the right of first publication. Although authors remain the copyright owner, they grant the journal the irrevocable, nonexclusive rights to publish, reproduce, publicly distribute and display, and transmit their article or portions thereof in any manner.