Kata Istilah |
Kata Sasar |
Kata Takrif |
corpus | korpus | Himpunan data bahasa lisan atau tulisan yang tulen, bersaiz besar dan disimpan secara elektronik dalam pangkalan data. |
static corpus | korpus statik | Himpunan data bahasa lisan atau tulisan yang tidak lagi ditambah setelah mencapai saiz yang ditentukan. |
specialised corpus | korpus khusus | Himpunan data bahasa lisan atau tulisan untuk tujuan khusus. |
Brown Corpus | Korpus Brown | Korpus yang mengandungi himpunan teks tulisan bahasa Inggeris (Amerika Syarikat) dalam bentuk elektronik bersaiz satu juta patah perkataan. |
on-line corpus | korpus dalam talian | Himpunan data bahasa lisan atau tulisan yang boleh dicapai secara dalam talian dan dimuat turun bagi penelitian dan analisis menggunakan perisian korpus. |
LancasterOslo/Bergen (LOB) Corpus | Korpus Lancaster-Oslo/Bergen (LOB) | Korpus yang mengandungi himpunan teks tulisan bahasa Inggeris (British) dalam bentuk elektronik bersaiz 1 juta patah perkataan. |
optical character recognition (OCR) | pengecaman aksara optik (OCR) | Teknologi pengecaman yang membezakan aksara teks (bercetak atau tulisan tangan) yang tertera dalam imej dokumen fizikal melalui imbasan dan memindahkannya dalam bentuk kod digital. |
balanced corpus | korpus seimbang | 1. Himpunan data bahasa yang terdiri daripada pelbagai genre dan domain teks yang merangkumi bahasa lisan dan tulisan untuk dijadikan sebagai korpus rujukan. 2. Korpus yang telah mencapai ketepuan tipa kata. Kebarangkalian muncul kata unik baharu adalah s |
Bank of English (BoE) | Bank of English (BoE) | Korpora pemantau yang dibangunkan oleh COBUILD dan Universiti Birmingham. Korpora ini terdiri daripada data lisan dan tulisan penutur jati bahasa Inggeris. |