Kata Istilah |
Kata Sasar |
Kata Takrif |
rank ordering | tertib pangkat | 1. Urutan bagi maklumat kekerapan dalam senarai perkataan yang boleh disusun mengikut susunan perkataan yang paling kerap sehingga yang paling rendah bilangannya. 2. Teknik yang digunakan dalam beberapa ujian statistik bukan parametrik, contohnya ujian Wi |
European Language Activity Network (ELAN) | Rangkaian Kegiatan Bahasa Eropah (ELAN) | Projek kajian bahasa yang membina korpora 30 bahasa Eropah dalam format yang sama serta menggunakan peranti yang mempunyai antara muka yang sepunya. |
text archive | arkib teks | Repositori data teks yang dikumpulkan secara pukal tanpa kriteria khusus. |
template tagger | penanda templat | Perisian yang membetulkan ralat penandaan secara automatik. |
tagset | set tanda | Kumpulan kod yang digunakan dalam pengekodan atau skema penandaan untuk menganotasi korpora berdasarkan teori bahasa, iaitu kategori nahu (penandaan golongan kata) atau kategori semantik. |
TAGGIT | TAGGIT | Perisian golongan kata terawal yang setnya terdiri daripada lapan puluh tujuh tanda, termasuk kelas kata utama dan varian infleksi serta kata fungsi. Alat ini digunakan untuk menandai Korpus Brown. |
tag transition probabilities | keberangkalian peralihan tanda | Kebarangkalian sesuatu tanda golongan kata tertentu diikuti oleh tanda lain dalam teks berturutan. Jika terdapat 50000 token yang ditandakan dengan KS dan 45000 daripadanya diikuti oleh token yang bertanda KN, maka kebarangkalian peralihan tanda untuk |
synchronic corpus | korpus sinkronik | Korpus yang mengandungi himpunan teks yang dihasilkan dalam tempoh sama bagi menggambarkan penggunaan bahasa pada masa tersebut. Banding diachronic corpus. |
Surface and Underlying Structural Analyses of Naturalistic English (SUSANNE) Corpus | Korpus Analisis Struktur Permukaan dan Dalaman Bahasa Inggeris Tabii (SUSANNE) | Korpus yang mempunyai skema anotasi taksonomi semantik dan tatabahasa bahasa Inggeris bagi pemprosesan bahasa tabii. |
stochastic tagging | penanda stokastik | Pendekatan penandaan golongan kata (POS) yang menggunakan kekerapan atau kebarangkalian. |