Feb, 2024

援足门:通过认知心理学理解大型语言模型破解

TL;DR大规模语言模型(LLM)的研究揭示了其内在决策逻辑,特别是在面对越狱攻击时的认知一致性理论和自动黑盒越狱方法。