Apr, 2022

为改善口语理解,朝着对话历史全面集成的方向发展

TL;DR本研究提出了一种基于层次对话模型的端到端口语理解框架,可在不依赖于级联自动语音识别器的情况下直接使用语音形式的对话历史,构建语音和语义嵌入的文本模型,针对训练时间提出一种名为 DropFrame 的新技术。在 HarperValleyBank 对话数据集上,我们的 E2E 历史记录集成在对话行为识别任务上,比基线模型提高了 7.7%的 F1 分数,使用了 48%更少的参数,超过了基线 10%的绝对 F1 分数。