Nov, 2023

认知过载:运用超负荷逻辑思维破解大型语言模型

TL;DR通过针对大型语言模型的认知结构与过程进行专门设计的破解攻击,本文揭示了多语言认知过载、隐晦表达和因果推理等对大型语言模型的安全漏洞,实验证明这些攻击可以成功破解主要的研究模型,并且现有的防御策略不能有效地抵御这些恶意使用。