Mar, 2024

AutoDefense: 多代理 LLM 防御封顶攻击

TL;DR通过大规模的实验,我们验证了 AutoDefense 对改进对抗越狱攻击的鲁棒性具有有效性,并且能够在正常用户请求时保持性能。