Jan, 2017

RUBER: 一种自动评估开放领域对话系统的无监督方法

TL;DR本文提出 RUBER 作为一个自动评估指标,旨在为开放式对话系统提供标准的评估方法,其评估响应时综合考虑了真实响应和查询的相关性,无需人工标注,适用于不同的数据集和语言,并通过实验与人工标注结果具有很高的相关性。