Jun, 2020

走向统一的对话系统评估:对当前评估协议的全面分析

TL;DR本文针对对话系统中的评估协议不统一的问题,综合研究了人工评估和自动评估方法,建议建立更加健壮和统一的评估协议,并对目前使用的自动、静态和交互式评估方法进行分析,最终通过与 Alexa Prize 2020 中的系统 - 用户对话数据进行比较,提出最有效的评估维度。