Kata Istilah |
Kata Sasar |
Kata Takrif |
clitic | klitik | Morfem yang mempunyai ciri-ciri sintaksis dan terikat secara fonologi dan leksikal dengan kata lain. Contohnya, -mu, -ku dan -nya dalam kata janjimu, janjiku dan janjinya. Dalam anotasi korpus, klitik perlu diasingkan daripada kata yang terikat dengannya. |
Linguistic Data Consortium (LDC) | Konsortium Data Linguistik (LDC) | Gabungan terbuka universiti, syarikat dan makmal penyelidikan bagi mengumpulkan, menghasilkan dan menyebarkan data lisan dan teks, leksikon serta sumber linguistik lain bagi penyelidikan dan pembangunan. |
European Language Resources Association (ELRA) | Persatuan Sumber Bahasa Eropah (ELRA) | Persatuan di Eropah yang mempromosikan dan mengawasi pengeluaran dan pengedaran sumber bahasa untuk digunakan dalam pemprosesan bahasa tabii (NLP), dan penilaian teknologi NLP. |
corpus linguistics | linguistik korpus | Perkaedahan dan subbidang kajian linguistik yang menggunakan data tulen, bersaiz besar dan dalam bentuk elektronik dengan tujuan menganalisis data, mencari bukti hipotesis bahasa dan sebagainya. |
Association for Literary and Linguistic Computing (ALLC) | Persatuan Pengkomputeran Kesusasteraan dan Linguistik (ALLC) | Persatuan berkaitan penggunaan pengkomputeran dalam kajian bahasa dan sastera. Keanggotaannya bersifat antarabangsa yang merangkumi pelajar dan penyelidik merentas disiplin kemanusiaan. |
comparable corpus | korpus sebanding | Himpunan teks dalam satu bahasa atau pelbagai bahasa yang kesemuanya dibina berasaskan reka bentuk dan pensampelan genre dan teks yang serupa. |
lemmatisation | pelemaan | Proses anotasi automatik yang mengumpulkan kata-kata dalam korpus mengikut lema. Pelemaan kata lari, berlari, melarikan, pelari, pelarian dan sebagainya dikenal pasti dan ditandakan lemanya sebagai LARI. |
terminology extraction | penyarian istilah | Penyaringan dan pemilihan maklumat untuk mengenal pasti dan menjana senarai perkataan dalam teks atau korpus bagi dijadikan istilah teknikal dalam pembinaan bank istilah. |
alphanumeric | abjad angka/alfanumerik | Kombinasi huruf dan angka termasuk simbol matematik dan tanda baca. |
parsing | penghuraian | Proses menghuraikan dan menandai struktur sintaksis teks mengikut kategori seperti frasa nama, frasa kerja dan klausa. |