automatic pronunciation assessment (APA) is vital for computer-assisted
language learning. Prior methods rely on annotated speech-text data to train
Automatic Speech Recognition (ASR) models or speech-score data to train
regression models. In this work, we propose a novel zero-shot APA
通过使用语言无关的语言特征,我们尝试利用英语中可用的数据,并在希腊语和法语等低资源语言中实现零样例失语症检测。我们提出了一种端到端流水线,使用预训练的自动语音识别(ASR)模型,共享跨语言语音表示,并进行微调,以实现我们所需的低资源语言。为了进一步提高我们的 ASR 模型的性能,我们还将其与语言模型结合在一起。我们证明,我们基于 ASR 的端到端流水线提供了与使用人工注释转录的先前设置相当的结果。