MMOct, 2022

使用语义对齐的语音表示进行口语语言理解

TL;DR本论文研究语义对齐的语音表示在端到端语音理解中的应用,并使用 SAMU-XLSR 模型,在不同语言中捕捉语音的语义,将语音表现学习模型(XLS-R)与语言无关的 BERT 句子嵌入(LaBSE)模型相结合。我们证明该模型的使用显著提高了端到端 SLU 的性能,并展示了在 SLU 中使用该模型的好处,特别是语言易携带性。