Apr, 2022

WaBERT:用于口语理解和语音到 BERT 对齐的低资源端到端模型

TL;DR本文提出了一种新颖的 Wave BERT(WaBERT)端到端模型,将语音模型和语言模型相结合,以用于口语理解任务,提高了语音特定信息和语言知识在短时间和低资源训练过程中的整合,从而在 SLUE SA 任务的开发数据集上将召回得分提高了 1.15%,F1 得分提高了 0.82%,此外还修改了序列连续整合和放电(CIF)机制,以实现语音和文本模态之间的单调对齐。