Feb, 2024

RefuteBench:评估大型语言模型的反驳指令跟随

TL;DR该研究论文介绍了大型语言模型在接受用户反馈方面的问题,并提出了一个包括问答、机器翻译和电子邮件写作等任务的综合评估基准 RefuteBench。研究发现,大型语言模型倾向于自身内部知识,并且在对话过程中逐渐遗忘用户的反馈,而回归到自己的回复,通过召回和重复提示的方式可以提高模型响应用户反馈的能力。