Kata Istilah |
Kata Sasar |
Kata Takrif |
approximate string matching | pemadanan rentetan hampiran | Kaedah mendapatkan semula maklumat menggunakan carian rentetan yang menghampiri kata yang dicari. Contohnya, carian dalam teks untuk kata kerajaan menggunakan kaedah pemadanan rentetan hampiran akan turut menghasilkan ralat kata seperti kerjaan, krej |
probabilistic disambiguation | penyahtaksaan keberangkalian | Kaedah menentukan tanda yang betul untuk item linguistik tertentu dalam korpus dengan menggunakan ukuran kebarangkalian. |
factor analysis | analisis faktor | Kaedah statistik untuk menganalisis set data yang mempunyai banyak pemboleh ubah. Analisis ini mengurangkan pemboleh ubah yang banyak kepada hanya beberapa pemboleh ubah utama melalui pengelompokan pemboleh ubah yang sama cirinya. |
rule-based disambiguation | penyahtaksaan berasaskan rumus | Kaedah menentukan tanda yang betul untuk item linguistik tertentu dalam korpus dengan menggunakan rumus bahasa. |
Maximum Likelihood Principle | Prinsip Kebolehjadian Maksimum | Kaedah statistik berdasarkan kebarangkalian untuk memilih tanda bagi satu perkataan yang ditandakan secara taksa. |
data-driven learning | pembelajaran berpacukan data | Kaedah pembelajaran bahasa yang menggunakan analisis konkordans. Contohnya, pelajar menjelaskan struktur bahasa berasaskan penemuan yang diperoleh daripada data yang dianalisis. |
corpus-driven approach | pendekatan berpacukan korpus | Kaedah membina linguistik yang dipacu oleh analisis data korpus. |
corpus-based approach | pendekatan berasaskan korpus | Kaedah menguji hipotesis linguistik berdasarkan analisis data korpus. |
precision and recall | kepersisan dan ingat kembali | Kaedah mengukur keberkesanan sesuatu penanda automatik berdasarkan ukuran bilangan tanda betul yang diberikan oleh penanda dan ukuran bilangan tanda salah yang berjaya dibuang. |
corpus-based lexicography | leksikografi berasaskan korpus | Teori dan kaedah menyusun kamus berdasarkan data korpus. |