Apr, 2023

那些不是你的记忆,是别人的:在聊天机器人中植入错误信息

TL;DR本文研究了聊天机器人长时记忆机制,发现它容易受到误导,记住错误信息并在后续对话中回答。我们用 BlenderBot2 和 BlenderBot3 等模型对其漏洞性进行了演示和评估,发现当误导信息存在于长时记忆中时,聊天机器人更容易以其为事实回答相关问题。