Jul, 2023

模态可信度感知的鲁棒端到端口语理解训练

TL;DR提出了一种增强对ASR错误鲁棒性的新型端到端(E2E)口语理解(SLU)系统,通过基于ASR假设的估计模态置信度融合音频和文本表示,来解决E2E SLU系统在文本表示质量低时的问题,并通过在STOP数据集上的准确性改进和分析来证明我们的方法的有效性。