Kata Istilah |
Kata Sasar |
Kata Takrif |
design | reka bentuk | Proses pertama dalam pembinaan korpus. Reka bentuk korpus bergantung pada tujuan dan kegunaannya bagi menentukan jenis, kandungan, struktur, saiz teks dan sebagainya. |
homogeneity | kehomogenan | Konsep dalam reka bentuk korpus, iaitu teks hanya diambil dari satu sumber atau sumber yang setara. |
compilation | penyusunan/kompilasi | Proses membina korpus berdasarkan reka bentuk, perancangan sistem penstoran, keizinan hak cipta, penangkapan teks dan sebagainya. |
intuitive data | data gerak hati/data intuitif | Data yang direka-reka bagi menjelaskan aspek linguistik tertentu dan tidak berasaskan data yang terbentuk secara tabii dan autentik. Banding attested data. |
documentation | dokumentasi | Manual pembinaan korpus yang lazimnya mengandungi maklumat seperti tujuan dan reka bentuk termasuk saiz, jenis teks, pensampelan, set tanda dan sebagainya. |
comparable corpus | korpus sebanding | Himpunan teks dalam satu bahasa atau pelbagai bahasa yang kesemuanya dibina berasaskan reka bentuk dan pensampelan genre dan teks yang serupa. |
first generation corpora | korpora generasi pertama | Korpora awal yang agak kecil saiznya sekitar 1 juta perkataan dan dibangunkan dengan reka bentuk yang hampir sama sekitar 1960-an hingga 1980-an seperti Korpus Brown. |
|
|