Apr, 2023
那些不是你的记忆,是别人的:在聊天机器人中植入错误信息
Those Aren't Your Memories, They're Somebody Else's: Seeding Misinformation in Chat Bot Memories
Conor Atkins, Benjamin Zi Hao Zhao, Hassan Jameel Asghar, Ian Wood, Mohamed Ali Kaafar
TL;DR本文研究了聊天机器人长时记忆机制,发现它容易受到误导,记住错误信息并在后续对话中回答。我们用 BlenderBot2 和 BlenderBot3 等模型对其漏洞性进行了演示和评估,发现当误导信息存在于长时记忆中时,聊天机器人更容易以其为事实回答相关问题。