Jan, 2024

零资源语言的多语种音频词向量

TL;DR该研究针对缺乏已标注数据的零资源语言开发语音应用的挑战,特别使用声学词嵌入(AWE),通过多语言转移利用来自几种资源丰富的语言的已标注数据。该研究介绍了一种新的神经网络,优于现有的 AWE 模型在零资源语言上的表现,研究还探讨了资源丰富语言的选择对结果的影响。AWE 应用于斯瓦希里语广播中的仇恨言论检测的关键词识别系统,展示了在实际场景中的稳健性。此外,新颖的语义 AWE 模型提高了语义查询示例搜索的性能。