Jan, 2022

跨模态 ASR 后处理系统,用于纠错和话语拒绝

TL;DR本文提出了一种跨模态后处理系统,包括融合不同模态的声学特征和文本特征、联合置信度估计器和错误修正器以及统一的错误修正和话语拒绝模块等,证明相较于单模型或单任务模型,该系统更加有效率地减小语音识别中字符错误率 (CER),且每个单词的额外延迟在可接受范围内。