Jul, 2023

模态可信度感知的鲁棒端到端口语理解训练

TL;DR提出了一种增强对 ASR 错误鲁棒性的新型端到端(E2E)口语理解(SLU)系统,通过基于 ASR 假设的估计模态置信度融合音频和文本表示,来解决 E2E SLU 系统在文本表示质量低时的问题,并通过在 STOP 数据集上的准确性改进和分析来证明我们的方法的有效性。