closed-set spoken language identification is the task of recognizing the
language being spoken in a recorded audio clip from a set of known languages.
In this study, a language identification system was built and trained to
distinguish between Arabic, Spanish, French, and Turkish based
通过使用语言无关的语言特征,我们尝试利用英语中可用的数据,并在希腊语和法语等低资源语言中实现零样例失语症检测。我们提出了一种端到端流水线,使用预训练的自动语音识别(ASR)模型,共享跨语言语音表示,并进行微调,以实现我们所需的低资源语言。为了进一步提高我们的 ASR 模型的性能,我们还将其与语言模型结合在一起。我们证明,我们基于 ASR 的端到端流水线提供了与使用人工注释转录的先前设置相当的结果。