Oct, 2019

SpeechBERT:一个用于端到端口语问答的音频和文本联合学习语言模型

TL;DR该研究提出了一种基于音频和文本联合训练的 SpeechBERT 模型,通过端对端地提取语音信息,解决了端到端口语问答任务中音频转换文本出现的问题,并且在包括 ASR 错误的数据集中表现出优异的性能。该模型可以为许多口语理解任务提供潜在的借鉴,其效果优于传统的级联 ASR 和 TQA 模型的方法。