Feb, 2024

WIPI:基于LLM的网络代理新威胁

TL;DRLLM驱动的Web Agents(英语简写为Web Agents)因其在像人脑一样通过多种网络工具与外部部署的网站进行积极互动时,具备强大的能力而备受关注。本文介绍了一种名为WIPI的新型威胁,其通过间接控制Web Agents在公开的网页中执行恶意指令。实验证明,即便在纯黑盒场景中,该方法达到了超过90%的平均攻击成功率(ASR),并且在多样化的前缀指令情况下仍具有高性能和强大的鲁棒性。