Kata Istilah |
Kata Sasar |
Kata Takrif |
mutual information | maklumat salingan | Ukuran statistik yang membandingkan antara kebarangkalian kehadiran dua item secara bersama dengan kebarangkalian setiap item tersebut secara bersendirian. Maklumat salingan sering digunakan sebagai ukuran kekuatan kolokasi antara dua perkataan. |
precision and recall | kepersisan dan ingat kembali | Kaedah mengukur keberkesanan sesuatu penanda automatik berdasarkan ukuran bilangan tanda betul yang diberikan oleh penanda dan ukuran bilangan tanda salah yang berjaya dibuang. |
probability | kebarangkalian | Ukuran berangka tentang kemungkinan berlakunya sesuatu peristiwa. Nilai kebarangkalian terletak antara 0 dengan 1. |
lexical richness | kekayaan leksikal | Ukuran dan pengiraan kata leksikal dalam sesuatu teks atau korpus melalui kiraan kata leksikal yang hanya digunakan sekali. Lihat juga lexical density. |
lexical density | ketumpatan leksikal | Ukuran dan pengiraan kata leksikal dalam sesuatu teks atau korpus berdasarkan peratusan kekerapan kata isi dibahagikan dengan bilangan kata atau token. Ketumpatan leksikal boleh juga dikira berdasarkan peratusan bilangan kata leksikal unik dibahagikan den |
probabilistic disambiguation | penyahtaksaan keberangkalian | Kaedah menentukan tanda yang betul untuk item linguistik tertentu dalam korpus dengan menggunakan ukuran kebarangkalian. |
dispersion value | nilai serakan | Kadar kejadian sesuatu kata atau frasa dalam fail atau korpus tertentu yang dihitung dengan menggunakan statistik deskriptif seperti sisihan piawai untuk memberikan ukuran sebaran kata atau frasa dengan nilai min data. |