Dec, 2023
LLM 的两面:杰基尔博士与海德先生
Dr. Jekyll and Mr. Hyde: Two Faces of LLMs
Matteo Gioele Collu, Tom Janssen-Groesbeek, Stefanos Koffas, Mauro Conti, Stjepan Picek
TL;DR利用对抗性角色,绕过 ChatGPT 和 Bard 聊天机器人的安全机制,使用大型语言模型结合聊天助手应用的技术,模仿提供禁止回答的信息,实现获取未经授权、非法或有害信息的攻击。