Jun, 2024

Raccoon: LLM 集成应用的提示提取基准

TL;DR介绍了一种全面评估模型对提示提取攻击易感性的新方法和基准测试,以及对现有防御和模型韧性的有效性进行评估,为评估 LLM 对提示提取攻击的鲁棒性建立了更系统的基准测试,并提出了攻击原因和潜在对策。