Apr, 2024
透过上下文学习揭示基础大型语言模型的滥用潜力
Unveiling the Misuse Potential of Base Large Language Models via
In-Context Learning
TL;DR大型语言模型的开源加速应用开发、创新和科学进步,但对于基础语言模型的固有指令限制是否可以防止滥用的普遍假设存在关键的疏忽。我们的研究通过精心设计的演示表明,基础语言模型能够有效地解释和执行恶意指令,此漏洞无需特殊知识或训练即可被操纵,强调了对基础语言模型安全协议的紧急关注的重大风险。