EMNLPOct, 2020

多领域对话中的联合转向和对话级别用户满意度估计

TL;DR提出了一种新颖的用户满意度估计方法,它可通过 BiLSTM 深度神经网络模型共同预测专家提供的转化级别响应质量标签和最终用户提供的显式对话级别评分,并自动权衡每个操作对估计对话级别评分的贡献,隐式编码时间依赖关系,无需手工制作特征。在 28 个 Alexa 领域、两个对话系统和三个用户组的对话中,综合对话级满意度估计模型比基准深度神经网络和梯度提升回归模型在线性相关性能上实现了最高达 27%(0.43->0.70)和 7%(0.63->0.70)的提升。