Kategori, fungsi, dan peran sintaksis bahasa Indonesia dengan PoS Tagging berbasis rule dan probability

Authors

  • Herpindo Herpindo Universitas Tidar
  • Asri Wijayanti Universitas Tidar
  • Irsyadi Shalima Universitas Tidar
  • Ratih Ngestrini Utrecht University

DOI:

https://doi.org/10.22219/kembara.v8i1.18602

Keywords:

Fungsi, Kategori, PoS tagging, Probability, Rule

Abstract

Penelitian ini dilatarbelakangi oleh kekurangan basis data gramatikal kategori khususnya pada verba yang belum lengkap yang menduduki fungsi predikat kopulatif, ekuatif, dan eksistensial dan belum adanya data Pos Tagging peran semantik agen dan pasien pada bahasa Indonesia. Diharapkan hasil penelitian ini dapat memprediksi kategori, fungsi, dan peran secara secara keseluruhan pada tiap kalimat. Penentuan kategori dilakukan dengan pembangunan model probability-based PoS Tagging, dan menghasilkan akurasi sebesar 92,53% dengan penambahan khusus tag verba (kopulatif, ekuatif, dan eksistensial) yang dapat menduduki posisi predikat dengan. Sementara itu, penentuan fungsi dan peran dilakukan dengan metode rule-based, yakni dengan pembuatan algoritma. Hasil akhir dari penelitian ini adalah kalimat baru dari The corpus ind_mixed_2013 Leipzig Corpora yang telah ditentukan kategori, fungsi, dan perannya untuk masing-masing kata. Pada penentuan peran agen, kedudukan agen pada kalimat yang diprediksi secara benar adalah sebanyak 82,58% dengan row label N dan PRON yang menduduki posisi agen bertipe nominative akusatif aktif, sedangkan pada peran pasien pada kalimat yang diprediksi secara benar adalah sebanyak 9,68% dengan row label N dan PRON dengan tipe pasif, ergative, dan anti-pasif. Temuan baru dalam penelitian ini adalah komponen verba (kopulatif, ekuatif dan eksistensial) yang dapat menduduki posisi predikat dalam secara fungsional dan potensi adanya tipologi ergative dengan diatesis ergative dan anti-pasif setelah diterapkan rule dan probability based dengan Pos Tagging.

Downloads

Download data is not yet available.

References

Alwi, H. et al. (2003). Tata bahasa baku bahasa Indonesia: Edisi Ketiga. Jakarta: Balai Pustaka.

Ambiya, M. Z. (2018). Keberlakuan nomina sebagai predikat dalam kalimat bahasa Indonesia: Kajian sintaksis (Noun Existence as predicate in sentence of Indonesian language: A study on syntax). Ranah: Jurnal Kajian Bahasa, 7(1), 49-68. https://doi.org/10.26499/rnh.v7i1.543

Antonio, S. (2017). A tentative corpus-based approach to English ergative verbs. July. https://doi.org/10.13140/RG.2.2.12120.19208

Arka, I. W. (2018). Lexical-functional grammar: Some of its basic principles and its challenge in its application to the languages of Indonesia. Pertemuan Linguistik Pusat Kajian Bahasa dan Budaya Atma Jaya 16. Jakarta: Yayasan Obor Indonesia.

Artawa, K. (2020). Pemarkahan diatesis bahasa Indonesia. Mozaik Humaniora, 20(1), 26-?. https://doi.org/10.20473/mozaik.v20i1.15128

Carina Silberer, M. P. (2018). Grounding semantic roles in images. In B. Brussels (Ed.), Proceedings of the 2018 Conference on Empirical Methods in Natural Language Processing (pp. 2616–2626). Association for Computational Linguistics. https://doi.org/10.18653/v1/D18-1282

Carroll, J. (2013). The Routledge handbook of corpus linguistics. London: Routledge.

Cholisi, F. (2013). A lexical-functional grammar representation. Jurnal Sosial Humaniora. 6(1), 46-61. https://doi.org/10.12962/j24433527.v6i1.610

Comrie, B. (1981). Language universals and linguistics typology. New Jersey: Basil Blackwell.

Coon, J., & Abenina-Adar, M. (2013). Ergativity in linguistics. Oxford: Oxford University Press.

Dewi, N. P., & Ubaidi, U. (2020). PoS tagging bahasa Madura dengan menggunakan algoritma Brill Tagger. Jurnal Teknologi Informasi dan Ilmu Komputer, 7(6), 1121-1128. https://doi.org/10.25126/jtiik.2020722449

Dixon, R. M. (1994). Ergativity. Cambridge: Cambridge University Press.

Effendi, D. E., & Muchammadun. (2018). “Happiness” in bahasa Indonesia and its implication to health and community well-being. Asian EFL Journal, 20(8), 279-291.

Falk, Y. (2011). Lexical-functional grammar. Oxford: Oxford University Press.

Gunawan, D., Amalia, A., & Maringga, O. N. (2019). Building the Application to identify incorrect capital letters writing in bahasa Indonesia. Journal of Physics: Conference Series, 1235(1), 1-7. https://doi.org/10.1088/1742-6596/1235/1/012108

Jia, J. K., Shao, Y. bin, Long, H., & Du, Q. Z. (2020). A natural language sentence analysis algorithm based on word order modifier syntax rules. Procedia Computer Science, 166, 496–500. https://doi.org/10.1016/j.procs.2020.02.058

Jufrizal, J. (2008). Tipologi linguistik: Dasar kerangka teori dan arah kajiannya. Linguistika, 1(3), 23-35. Retrieved from http://jurnalvivid.fib.unand.ac.id/index.php/lingkul/index

Jurafsky, D., Martin, J, H. (2000). Speech and language processing. Britain: Prentice Hall.

Kridalaksana, H. (1988). Beberapa prinsip perpaduan leksem dalam bahasa Indonesia. Jakarta: Kanisius.

Kridalaksana, H. (2008). Kamus linguistik edisi keempat. Jakarta: Gramedia Pustaka Utama.

Mallinson, G. dan B. J. B. (1981). Language typology: Cross-linguistic studies in syntax. North-Holland Publishing Company.

Mughni, M. B. M. Y. (2021). Perbandingan kata kerja tak akusatif dengan kata kerja tak ergatif bahasa Melayu: Analisis Aktionsart. Jurnal Linguistik, 24(1). 19-32. doi: 10.31604/linguistik.v3i1.19-38

Musgrave, S. (2013). Functional categories in the syntax and semantics of Malay. NUSA: Linguistic Studies of Languages in and around Indonesia, 55, 135–152. Retrieved from http://repository.tufs.ac.jp/bitstream/10108/74330/2/nusa5509.pdf

Pramudita, H. R., Utami, E., & Amborowati, A. (2016). Pengaruh part of speech tagging berbasis aturan dan distribusi probabilitas maximum entropy untuk bahasa Jawa Krama. Jurnal Buana Informatika, 7(4), 10-25. https://doi.org/10.24002/jbi.v7i4.764

Pye, C. (1990). The acquisition of ergative languages. Linguistics, 28(6), 1291-1330. https://doi.org/10.1515/ling.1990.28.6.1291

Rajeg, G. P. W., Denistia, K., & Rajeg, I. M. (2019). Working with a linguistic corpus using r: An introductory note with Indonesian negating construction. Linguistik Indonesia, 36(1), 1–36. https://doi.org/10.26499/li.v36i1.71

Ramlan. (1987). Ilmu bahasa Indonesia, sintaksis. Yogyakarta: CV Karyono.

Rober, D. Van Valin, Jr. R. J. L. (2001). Syntax: Structure, meaning and Fuction. Cambridge: Cambridge University Press.

Satriya, S., & Wisnu, T. (2016). Pasif periferal: Struktur ergatif dalam bahasa Indonesia. Metalingua. 14(2), 233–242. http://dx.doi.org/10.26499/metalingua.v14i2.199

Sherly, Novita, M. (2019). Pembentukan verba ergatif dalam bahasa Hokkien: Kajian morfosintaksis. 26(1), 8-17. https://doi.org/ttps://doi.org/10.24843/ling.2019.v26.i01.p02.

Sneddon, J. N., Adelaar, A., Djenar, D. N., & Ewing, M. C. (2010). Indonesian Reference Grammar. Oxford: Allen & Unwin.

Song, J. J. (2014). Linguistic typology (1st Edition). Britain: Oxford University Press.

Syahroni, Abd. Wahab, H. (2019). Aplikasi penentuan kategori dan fungsi sintaksis kalimat bahasa Indonesia. InfoTekJar: Jurnal Nasional Informatika dan Teknologi Jaringan, 1(3), 13-20 https://doi.org/https://doi.org/10.30743/infotekjar.v4i1.1537

Tallerman, M. (2014). Understanding syntax. (Fourth Edition). New York: Routledge.

Tallerman, M. (2015). Understanding syntax (Fourth edi). New York: Routledge.

Verhaar, J. W., & Alip, B. (1996). Asas-asas linguistik umum. Yogyakarta: Gadjah Mada University Press.

Widhiyanti, K., & Harjoko, A. (2013a). PoS tagging bahasa Indonesia dengan HMM dan rule based. Jurnal Informatika, 8(2), 151-167. https://doi.org/10.21460/inf.2012.82.125

Yazid, A. S., & Fatwanto, A. (2018). Penentuan kelas kata pada part of speech tagging kata ambigu bahasa Indonesia. JISKA (Jurnal Informatika Sunan Kalijaga), 2(3), 157-166. https://doi.org/10.14421/jiska.2018.23-05

Yuki, L. K. (2021). Study of the meaning of lelaki, bujang and bujangan words in the utilisation of Indonesian corpus. Jurnal Sasindo UNPAM, 9(1).81-93 https://doi.org/10.32493/sasindo.v9i1.81-93

Yusuf, K., & Puspita, D. (2020). Diachronic corpora as a tool for tracing etymological information of Indonesian-Malay Lexicon. Register Journal, 13(1), 153-182. https://doi.org/10.18326/rgt.v13i1.153-182

Downloads

Published

2022-04-14

How to Cite

Herpindo, H., Wijayanti, A. ., Shalima, I. ., & Ngestrini, R. . (2022). Kategori, fungsi, dan peran sintaksis bahasa Indonesia dengan PoS Tagging berbasis rule dan probability. KEMBARA: Jurnal Keilmuan Bahasa, Sastra, Dan Pengajarannya, 8(1), 51–65. https://doi.org/10.22219/kembara.v8i1.18602

Issue

Section

Articles