Feb, 2022

探究面向对话系统的训练度量的鲁棒性

TL;DR本文介绍一种对话系统对话回复的鲁棒性测试方法,利用对抗学习方法提取出优化得分的回复策略,并利用该方法测试最近提出的训练度量标准,发现它们均容易将相对简单且明显存在缺陷的策略高分,如直接复制对话环境中的部分内容拼成回复竟然可以超越甚至优于人类翻译的水平。