Oct, 2024

代理安全基准(ASB):形式化与基准化基于LLM的代理的攻击与防御

TL;DR本文解决了现有文献中对基于大型语言模型(LLM)的代理攻击与防御评估不全面的问题。提出的“代理安全基准”(ASB)框架形式化、基准化与评估LLM代理的攻击与防御,发现了不同阶段的关键漏洞,攻击成功率高达84.30%。此项研究为代理安全领域的重要问题提供了新的洞见与挑战。