Kata Istilah |
Kata Sasar |
Kata Takrif |
language engineering | kejuruteraan bahasa | Bidang pengkomputeran yang menggunakan peranti seperti kamus boleh dibaca mesin dan penghurai ayat dalam pemprosesan bahasa tabii untuk membangunkan aplikasi sintesis pertuturan, pengecaman pertuturan, penterjemahan mesin dan sebagainya. |
Center for Spoken Language Understanding (CSLU) Speech Corpora | Korpora Lisan Pusat Kefahaman Bahasa Pertuturan | Korpora pertuturan yang merangkumi pelbagai bahasa dan mengandungi data daripada bahasa seperti bahasa Jepun, Korea, Parsi dan sebagainya. |
spoken corpus | korpus pertuturan | Himpunan data bahasa percakapan yang telah ditranskripsi seperti perbualan tidak formal, panggilan telefon dalam siaran radio dan sebagainya. |
modified data | data terubah suai | Data nyata yang telah diubahsuai. Contohnya, data pertuturan yang telah digugurkan aspek nada suara. |
multi-dimensional analysis | analisis pelbagai dimensi | Pendekatan statistik perbandingan dalam menganalisis pelbagai genre pertuturan dan penulisan. |
Human Communication Research Centre (HCRC) Map Task Corpus | Korpus Peta Tugasan Pusat Penyelidikan Komunikasi Manusia | Korpus pertuturan berdasarkan tugasan eksperimen yang mengandungi 1,470,000 perkataan. |
Speech Analyzer | Speech Analyzer | Pakej perisian yang menyediakan keupayaan untuk memerhati dan menambah anotasi pada bentuk isyarat gelombang pertuturan. Pakej ini boleh didapati secara percuma daripada https://software.sil.org/speech-analyzer/ |
ethics | etika | Prinsip dan nilai yang perlu dipatuhi dalam pengumpulan korpus seperti mendapatkan kebenaran hak cipta, persetujuan untuk dirakam daripada sumber data bagi korpus lisan/pertuturan serta tidak mengubah ketulenan teks. |