Kata Istilah |
Kata Sasar |
Kata Takrif |
Linguistic Data Consortium (LDC) | Konsortium Data Linguistik (LDC) | Gabungan terbuka universiti, syarikat dan makmal penyelidikan bagi mengumpulkan, menghasilkan dan menyebarkan data lisan dan teks, leksikon serta sumber linguistik lain bagi penyelidikan dan pembangunan. |
rank ordering | tertib pangkat | 1. Urutan bagi maklumat kekerapan dalam senarai perkataan yang boleh disusun mengikut susunan perkataan yang paling kerap sehingga yang paling rendah bilangannya. 2. Teknik yang digunakan dalam beberapa ujian statistik bukan parametrik, contohnya ujian Wi |
empiricism | empirisisme | Pendekatan berdasarkan pemerhatian terhadap data sebenar bahasa bagi mengetahui cara sesuatu bahasa berfungsi. |
BNC Web | sesawang BNC/web BNC | Peranti berasaskan sesawang bagi analisis korpus seperti carian kata, pengiraan statistik kolokasi, analisis distribusi dan sebagainya daripada teks korpus BNC. |
post-editing | pascasunting | Penyuntingan secara manual yang dilakukan setelah penandaan automatik bagi mencapai ketepatan 100 peratus. |
phrase structure | struktur frasa | Unsur utama yang membina ayat. Contohnya frasa bagi ayat Beberapa orang pelajar menonton televisyen adalah seperti yang berikut: A= [FN Beberapa orang pelajar ] [ FK menonton] [ FN televisyen] A = ayat, FN = frasa nama, FK = frasa kerja |
intuitive data | data gerak hati/data intuitif | Data yang direka-reka bagi menjelaskan aspek linguistik tertentu dan tidak berasaskan data yang terbentuk secara tabii dan autentik. Banding attested data. |
Maximum Likelihood Principle | Prinsip Kebolehjadian Maksimum | Kaedah statistik berdasarkan kebarangkalian untuk memilih tanda bagi satu perkataan yang ditandakan secara taksa. |
dynamic corpus | korpus dinamik | Korpus yang saiznya semakin bertambah dari semasa ke semasa bagi meneliti perubahan bahasa dan dikenali juga sebagai korpora pemantau. Sinonim monitor corpus. |
synchronic corpus | korpus sinkronik | Korpus yang mengandungi himpunan teks yang dihasilkan dalam tempoh sama bagi menggambarkan penggunaan bahasa pada masa tersebut. Banding diachronic corpus. |