Kata Istilah |
Kata Sasar |
Kata Takrif |
closure | tutupan | Ciri tertentu dalam korpus yang menjadikan korpus itu mencapai status keterwakilan dan tiada leksikal, frasa atau rumus nahu baharu ditemukan dalam korpus. |
term bank | bank istilah | Senarai istilah teknikal bidang tertentu dalam pangkalan data elektronik. |
information extraction | penyarian maklumat | Proses menapis, memilih dan mengasingkan maklumat tertentu daripada teks dengan menggunakan program komputer. Maklumat ini ditandai dalam teks dan disimpan dalam pangkalan data. |
header | kepala | Maklumat mengenai sesuatu teks yang dikodkan dalam format tertentu dan muncul di bahagian atas fail sebelum isi teks. Maklumat ini merupakan sebahagian metadata. |
tag transition probabilities | keberangkalian peralihan tanda | Kebarangkalian sesuatu tanda golongan kata tertentu diikuti oleh tanda lain dalam teks berturutan. Jika terdapat 50000 token yang ditandakan dengan KS dan 45000 daripadanya diikuti oleh token yang bertanda KN, maka kebarangkalian peralihan tanda untuk |
probabilistic disambiguation | penyahtaksaan keberangkalian | Kaedah menentukan tanda yang betul untuk item linguistik tertentu dalam korpus dengan menggunakan ukuran kebarangkalian. |
diachronic corpus | korpus diakronik | Korpus yang mengandungi himpunan teks masa lampau yang tertentu untuk meneliti perubahan bahasa. Banding synchronic corpus. |
sample text corpus | korpus teks sampel | Korpus yang direka bentuk untuk mewakili ragam bahasa tertentu. Korpus ini boleh terdiri daripada teks lengkap atau sampel sebahagian teks daripada teks penuh. |
rule-based disambiguation | penyahtaksaan berasaskan rumus | Kaedah menentukan tanda yang betul untuk item linguistik tertentu dalam korpus dengan menggunakan rumus bahasa. |
dispersion value | nilai serakan | Kadar kejadian sesuatu kata atau frasa dalam fail atau korpus tertentu yang dihitung dengan menggunakan statistik deskriptif seperti sisihan piawai untuk memberikan ukuran sebaran kata atau frasa dengan nilai min data. |