MMFeb, 2024

TrustAgent:通过 Agent 组织构建实现安全可信的 LLM-based 代理

TL;DR通过引入安全意识并探索安全与可信性之间的关系,这篇论文提出了基于 Agent-Constitution 的代理框架 TrustAgent,为提高 LLM-based agents 的安全性而进行了初步研究,采用了预先规划、规划中和规划后策略来提升代理的安全性,并在实验中演示了这些方法如何识别和防止潜在的危险。