Kata Istilah |
Kata Sasar |
Kata Takrif |
gold standard corpus | korpus piawai emas | Korpus yang anotasinya telah diperiksa dan dibetulkan secara manual untuk dijadikan sebagai penanda aras bagi menentukan kesahan dan ketepatan penanda automatik. |
Standard Generalised Markup Language (SGML) | Bahasa Penanda Teritlak Piawai (SGML) | Bahasa meta yang mempunyai piawaian ISO 8879:1986 yang membolehkan pengguna mentakrifkan bahasa penanda bagi sesuatu dokumen. |
Binary File Transfer (BFT) | Pemindahan Fail Dedua (BFT) | Satu piawai pemindahan fail perduaan, perisian, dokumen, video, imej dan maklumat pertukaran data elektronik di antara peranti komunikasi termasuk komputer peribadi dan mesin faksimili. |
compliant | patuh | Ciri sesuatu korpus, teks, perisian atau skema anotasi yang mematuhi piawai seperti SGML, XML atau TEI. |
Extensible Markup Language (XML) | Bahasa Penanda Tambahan (XML) | Bahasa penanda berdasarkan Bahasa Penanda Teritlak Piawai (SGML) yang digunakan untuk pengekodan teks digital. Semua tanda mesti berpasangan seperti untuk tanda permulaan dan untuk tanda akhir atau untuk gabungan tanda permulaan dan tanda |
dispersion value | nilai serakan | Kadar kejadian sesuatu kata atau frasa dalam fail atau korpus tertentu yang dihitung dengan menggunakan statistik deskriptif seperti sisihan piawai untuk memberikan ukuran sebaran kata atau frasa dengan nilai min data. |
Institut für Maschinelle Sprachverarbeitung (IMS) Corpus Work Bench | Meja Kerja Korpus Institut für Maschinelle Sprachverarbeitung | Perisian konkordans yang mampu menangani pertanyaan kompleks dalam korpora ekabahasa dan korpora selari. Perisian ini dapat membaca tanda dan teks yang ditandai Bahasa Penanda Teritlak Piawai (SGML). |