Kata Istilah |
Kata Sasar |
Kata Takrif |
attested data | data nyata | Data tulen yang diperakui benar dan terbentuk secara tabii serta bukan merupakan data rekaan. Banding intuitive data. |
AntConc | AntConc | Perisian analisis korpus yang mempunyai pelbagai fungsi seperti carian kata kunci, konkordans, kolokasi, n-gram serta janaan senarai kata. |
TAGGIT | TAGGIT | Perisian golongan kata terawal yang setnya terdiri daripada lapan puluh tujuh tanda, termasuk kelas kata utama dan varian infleksi serta kata fungsi. Alat ini digunakan untuk menandai Korpus Brown. |
European Language Activity Network (ELAN) | Rangkaian Kegiatan Bahasa Eropah (ELAN) | Projek kajian bahasa yang membina korpora 30 bahasa Eropah dalam format yang sama serta menggunakan peranti yang mempunyai antara muka yang sepunya. |
Linguistic Data Consortium (LDC) | Konsortium Data Linguistik (LDC) | Gabungan terbuka universiti, syarikat dan makmal penyelidikan bagi mengumpulkan, menghasilkan dan menyebarkan data lisan dan teks, leksikon serta sumber linguistik lain bagi penyelidikan dan pembangunan. |
ethics | etika | Prinsip dan nilai yang perlu dipatuhi dalam pengumpulan korpus seperti mendapatkan kebenaran hak cipta, persetujuan untuk dirakam daripada sumber data bagi korpus lisan/pertuturan serta tidak mengubah ketulenan teks. |