Kata Istilah |
Kata Sasar |
Kata Takrif |
accented character | aksara bertanda | Huruf, angka, simbol dan lain-lain yang mempunyai tanda diakritik yang ditambahkan pada huruf, angka atau simbol tersebut untuk memberi nilai linguistik tertentu. Dalam korpus, aksara bertanda ini perlu dikodkan dengan penggunaan simbol & untuk permulaa |
semantic tagger | penanda semantik | Perisian yang menyematkan kod semantik pada perkataan dengan berpandukan sesuatu kerangka, seperti Sistem Analisis Semantik UCREL (USAS), WordNet, SUSANNE dan lain-lain. |
string | rentetan | Urutan huruf, nombor atau simbol lain dan biasanya agak pendek. |
keyword | kata kunci | Kata yang mencirikan sesuatu korpus berbanding dengan korpus lain seperti korpus rujukan. Kata kunci dikenal pasti berdasarkan kekerapan yang lebih tinggi dan signifikan dalam korpus sasaran berbanding korpus yang dibandingkan. |
tag transition probabilities | keberangkalian peralihan tanda | Kebarangkalian sesuatu tanda golongan kata tertentu diikuti oleh tanda lain dalam teks berturutan. Jika terdapat 50000 token yang ditandakan dengan KS dan 45000 daripadanya diikuti oleh token yang bertanda KN, maka kebarangkalian peralihan tanda untuk |
imaginative prose | prosa imaginatif | Teks bahasa berbentuk fiksyen merangkumi genre sastera dan bentuk penulisan kreatif lain seperti novel, drama, puisi dan lagu. |
cognate | kognat | Kata yang mempunyai hubungan bentuk dan makna dengan kata yang serupa bentuknya dalam bahasa lain. Kognat digunakan bagi teknik menjajarkan ayat dalam korpora dwibahasa atau pelbagai bahasa. |
co-occurrence | kejadian bersama | Kebarangkalian dua kata yang hadir secara bergandingan atau berdekatan antara satu sama lain. Lihat juga collocation, colligation. |
clitic | klitik | Morfem yang mempunyai ciri-ciri sintaksis dan terikat secara fonologi dan leksikal dengan kata lain. Contohnya, -mu, -ku dan -nya dalam kata janjimu, janjiku dan janjinya. Dalam anotasi korpus, klitik perlu diasingkan daripada kata yang terikat dengannya. |
comparability | kebolehbandingan | Tahap penyeragaman struktur, saiz dan komposisi teks yang membolehkan dua korpora dibandingkan antara satu sama lain. |
|
Puisi |
---|
|
Lain hulu lain pemarang, Buah bidara di atas bukit; Lain dahulu lain sekarang, Jauh beza bukan sedikit.
Lihat selanjutnya... |
|