Feb, 2024

跳出规则:多轮对话中大型语言模型的安全漏洞

TL;DR人们利用多轮对话诱导大型语言模型生成有害信息的研究揭示了当前大型语言模型的安全机制在复杂场景中存在的脆弱性。