Jun, 2023

朝向更准确、更具普适性的任务驱动式对话评测指标

TL;DR通过使用 Dialog Quality Annotation(DQA)工作流程,对整个对话进行评估和标注,我们展示出使用有监督的模型进行对话质量估计的效果较纯粹基于整合对话层次特征的方法更好,同时建议使用高质量的人工注释数据是评估大型工业规模语音助手平台交互质量的重要组成部分。