Dec, 2022

口语理解任务中,文本、声学和栅格表示的有效性

TL;DR本文对三种不同的系统进行了测试,分别为基于文本、基于格子以及基于多模态,研究了在不同情况下使用不同系统的表现;实验结果表明,使用更丰富的自动语音识别输出可以提高语言理解系统的性能,而跨模态的方法可以克服使用自动生成的文本时的问题,并获得约 17.8% 的相对改进。