Kata Istilah |
Kata Sasar |
Kata Takrif |
lexicon | leksikon | Himpunan perbendaharaan kata yang dijana daripada korpus bersama maklumat tambahan seperti tanda golongan kata, makna dan sebagainya. |
corpus | korpus | Himpunan data bahasa lisan atau tulisan yang tulen, bersaiz besar dan disimpan secara elektronik dalam pangkalan data. |
static corpus | korpus statik | Himpunan data bahasa lisan atau tulisan yang tidak lagi ditambah setelah mencapai saiz yang ditentukan. |
spoken corpus | korpus pertuturan | Himpunan data bahasa percakapan yang telah ditranskripsi seperti perbualan tidak formal, panggilan telefon dalam siaran radio dan sebagainya. |
speech corpus | korpus lisan | Himpunan data bahasa lisan dalam bentuk rakaman, bukan transkripsi yang digunakan untuk kajian sebutan, fonetik dan fonologi. |
specialised corpus | korpus khusus | Himpunan data bahasa lisan atau tulisan untuk tujuan khusus. |
parallel corpus | korpus selari | Himpunan data dua bahasa berbeza yang disejajarkan, sama ada ayat demi ayat atau perenggan demi perenggan atau teks demi teks. |
Korpus DBP | Korpus DBP | Himpunan teks yang disimpan oleh Dewan Bahasa dan Pustaka secara digital dalam pangkalan data dan diberikan penandaan tertentu untuk penyelidikan bahasa. |
comparable corpus | korpus sebanding | Himpunan teks dalam satu bahasa atau pelbagai bahasa yang kesemuanya dibina berasaskan reka bentuk dan pensampelan genre dan teks yang serupa. |
character set | set aksara | Himpunan sejumlah aksara yang terdiri daripada abjad, nombor dan simbol bagi melambangkan teks secara digital. |
|
|