Sep, 2023

开放域对话质量评估:从对话轮次评分推导出金块级别得分

TL;DR通过将对话系统的对话转换为表达与对话行为相关的片段,并借助现有的对话水平评估系统,我们提出了一种评估方法,从而在定位潜在问题所在时能够实现更精细的评估。通过案例研究,我们展示了我们评估方法的潜在有效性。