BriefGPT.xyz
Ask
alpha
关键词
refutebench
搜索结果 - 1
RefuteBench:评估大型语言模型的反驳指令跟随
该研究论文介绍了大型语言模型在接受用户反馈方面的问题,并提出了一个包括问答、机器翻译和电子邮件写作等任务的综合评估基准 RefuteBench。研究发现,大型语言模型倾向于自身内部知识,并且在对话过程中逐渐遗忘用户的反馈,而回归到自己的回复
→
PDF
5 months ago
Prev
Next