EMNLPOct, 2023

从自由文本人类反馈中学习 -- 收集新数据集还是扩展现有数据集?

TL;DR通过人类的自由文本反馈进行学习对于对话系统至关重要,本文通过研究多个常用的对话数据集,包括 MultiWoZ,SGD,BABI,PersonaChat,Wizards-of-Wikipedia 和 Self-Feeding Chatbot 的人机分离数据集,发现了数据集的组成情况,误差类型,用户响应类型以及它们之间的关系,并研究了将这些数据包含在语言生成模型 (response generation) 中的影响。