Kata Istilah |
Kata Sasar |
Kata Takrif |
national corpus | korpus kebangsaan | Korpus bersaiz besar yang mewakili pelbagai domain penggunaan bahasa kebangsaan dan sering dinamakan sempena negara asalnya seperti British National Corpus (BNC). |
mega corpora | korpora mega | Korpora yang bersaiz sangat besar dengan 100 juta perkataan atau lebih. |
sampler corpus | korpus pensampel | Korpus percontohan daripada korpus yang besar. Korpus ini digunakan sebagai korpus latihan atau korpus bandingan dalam menjanakan senarai kata kunci. |
corpus | korpus | Himpunan data bahasa lisan atau tulisan yang tulen, bersaiz besar dan disimpan secara elektronik dalam pangkalan data. |
corpus linguistics | linguistik korpus | Perkaedahan dan subbidang kajian linguistik yang menggunakan data tulen, bersaiz besar dan dalam bentuk elektronik dengan tujuan menganalisis data, mencari bukti hipotesis bahasa dan sebagainya. |
second generation corpora | korpora generasi kedua | Korpora yang dibangunkan semasa atau selepas 1990-an dan merupakan megakorpora kerana saiz yang besar, iaitu sekitar 100 juta perkataan atau lebih seperti British National Corpus (BNC) dan Bank of English (BoE). |
sample corpus | korpus sampel | Korpus bersaiz terhad yang terdiri daripada segmen teks terpilih yang merupakan subset daripada teks korpus bersaiz besar. |