Kata Istilah |
Kata Sasar |
Kata Takrif |
language independent tagger | penanda bebas bahasa | Perisian yang tidak terbatas pada satu bahasa sahaja, walau bagaimanapun pengguna perlu memuatkan tanda-tanda khusus berserta sampel teks bertanda bagi bahasa yang dikaji. |
tag transition probabilities | keberangkalian peralihan tanda | Kebarangkalian sesuatu tanda golongan kata tertentu diikuti oleh tanda lain dalam teks berturutan. Jika terdapat 50000 token yang ditandakan dengan KS dan 45000 daripadanya diikuti oleh token yang bertanda KN, maka kebarangkalian peralihan tanda untuk |
ditto tags | tanda ditto | Tanda yang sama digunakan untuk menandai setiap unsur dalam sesuatu frasa atau rangkai kata. Misalnya dalam ayat Asmiah sering kali membantu mereka, sering kali berfungsi sebagai penerang kepada kata kerja. Tanda yang sama KS digunakan untuk sering_KS |
Extensible Markup Language (XML) | Bahasa Penanda Tambahan (XML) | Bahasa penanda berdasarkan Bahasa Penanda Teritlak Piawai (SGML) yang digunakan untuk pengekodan teks digital. Semua tanda mesti berpasangan seperti untuk tanda permulaan dan untuk tanda akhir atau untuk gabungan tanda permulaan dan tanda |
tag stripping | pelucutan tanda | Proses menggugurkan tanda pada korpus bertanda. |
precision and recall | kepersisan dan ingat kembali | Kaedah mengukur keberkesanan sesuatu penanda automatik berdasarkan ukuran bilangan tanda betul yang diberikan oleh penanda dan ukuran bilangan tanda salah yang berjaya dibuang. |
tagset | set tanda | Kumpulan kod yang digunakan dalam pengekodan atau skema penandaan untuk menganotasi korpora berdasarkan teori bahasa, iaitu kategori nahu (penandaan golongan kata) atau kategori semantik. |
parts-of-speech tags (POS tags) | tanda golongan kata (POS tags) | Kod yang diberikan pada setiap perkataan dalam korpus untuk menunjukkan kategori tatabahasa perkataan itu contohnya kata nama, kata kerja, kata adjektif dan sebagainya. |
parser | penghurai | Perisian yang menambah tanda penghuraian pada teks secara automatik, contohnya Link Grammar Parser. |
probabilistic disambiguation | penyahtaksaan keberangkalian | Kaedah menentukan tanda yang betul untuk item linguistik tertentu dalam korpus dengan menggunakan ukuran kebarangkalian. |