Kata Istilah |
Kata Sasar |
Kata Takrif |
markup | penanda | Maklumat bukan linguistik pada korpus seperti struktur teks, perenggan, muka surat, bahasa, penutur, penulis, tarikh rakaman, jantina, format, pencetakan atau pemprosesan yang lain. |
speech corpus | korpus lisan | Himpunan data bahasa lisan dalam bentuk rakaman, bukan transkripsi yang digunakan untuk kajian sebutan, fonetik dan fonologi. |
authentic text | teks tulen | Teks sebenar yang terbentuk secara tabii dan bukan merupakan data rekaan pengkaji. |
authenticity | ketulenan | Keaslian data yang merujuk keadaan data yang terbentuk secara tabii dan bukan rekaan pengkaji. |
Link Grammar Parser | Link Grammar Parser | Penghurai automatik yang disediakan secara percuma untuk penyelidikan bukan komersial. |
collocate | kolokat | Perkataan yang berganding secara lazim atau mempunyai gandingan kekerapan yang tinggi dan bukan secara rawak. |
attested data | data nyata | Data tulen yang diperakui benar dan terbentuk secara tabii serta bukan merupakan data rekaan. Banding intuitive data. |
lexical priming | terangsang sedia leksikal | Ciri sesuatu kata X yang mencetuskan gandingan antara kata X dengan kata yang lain. Gandingan ini membentuk kolokasi dan koligasi yang bukan rawak tetapi terangsang sedia. |
Constituent Likelihood Automatic Word-tagging System (CLAWS) | Sistem Penandaan Kata Automatik berasaskan Kebolehjadian Unsur (CLAWS) | Perisian yang menandai golongan kata berdasarkan korpus dengan menerapkan pendekatan penyahtaksaan kebarangkalian, bukan hanya berdasarkan peraturan tatabahasa semata-mata. |
common core hypothesis | hipotesis teras sepunya | Teori yang menunjukkan semua jenis bahasa Inggeris mempunyai ciri-ciri asas utama yang sepunya, yang hanya berbeza dari segi kuantitatif dan bukan secara kualitatif. |