Sep, 2024

PROMPTFUZZ:利用模糊测试技术提升大型语言模型对提示注入攻击的稳健性测试

TL;DR本研究针对大型语言模型(LLMs)在提示注入攻击下的安全性和可靠性问题,提出了一种名为PROMPTFUZZ的新型测试框架。通过模糊测试技术,PROMPTFUZZ能够系统性地评估LLMs的稳健性,并有效发现模型中的漏洞,从而为这些模型的实际应用提供了有效的安全保障。