Kata Istilah |
Kata Sasar |
Kata Takrif |
TAGGIT | TAGGIT | Perisian golongan kata terawal yang setnya terdiri daripada lapan puluh tujuh tanda, termasuk kelas kata utama dan varian infleksi serta kata fungsi. Alat ini digunakan untuk menandai Korpus Brown. |
part-of-speech tagging (POS) | penandaan golongan kata (POS) | Proses anotasi kategori tatabahasa pada perkataan, morfem atau frasa, biasanya melalui penanda automatik seperti penanda CLAWS dan TAGGIT. |
stochastic tagging | penanda stokastik | Pendekatan penandaan golongan kata (POS) yang menggunakan kekerapan atau kebarangkalian. |
parts-of-speech tags (POS tags) | tanda golongan kata (POS tags) | Kod yang diberikan pada setiap perkataan dalam korpus untuk menunjukkan kategori tatabahasa perkataan itu contohnya kata nama, kata kerja, kata adjektif dan sebagainya. |
tag transition probabilities | keberangkalian peralihan tanda | Kebarangkalian sesuatu tanda golongan kata tertentu diikuti oleh tanda lain dalam teks berturutan. Jika terdapat 50000 token yang ditandakan dengan KS dan 45000 daripadanya diikuti oleh token yang bertanda KN, maka kebarangkalian peralihan tanda untuk |
annotation | anotasi | Penandaan maklumat linguistik pada korpus seperti penandaan golongan kata, morfologi, prosodi dan semantik. |
lexicon | leksikon | Himpunan perbendaharaan kata yang dijana daripada korpus bersama maklumat tambahan seperti tanda golongan kata, makna dan sebagainya. |
Constituent Likelihood Automatic Word-tagging System (CLAWS) | Sistem Penandaan Kata Automatik berasaskan Kebolehjadian Unsur (CLAWS) | Perisian yang menandai golongan kata berdasarkan korpus dengan menerapkan pendekatan penyahtaksaan kebarangkalian, bukan hanya berdasarkan peraturan tatabahasa semata-mata. |
content words | kata isi | Perkataan yang mempunyai makna dan boleh berdiri sendiri dalam ayat. Kata isi ini terdiri daripada golongan kata nama, kata kerja dan kata adjektif. Kata isi dikenali juga sebagai kata leksikal. |
tagset | set tanda | Kumpulan kod yang digunakan dalam pengekodan atau skema penandaan untuk menganotasi korpora berdasarkan teori bahasa, iaitu kategori nahu (penandaan golongan kata) atau kategori semantik. |