BriefGPT.xyz
大模型
Ask
alpha
关键词
deceptive content
搜索结果 - 2
利用检索增强生成模型的漏洞
该研究论文探讨了检索增强的生成模型(RAG)如何整合外部知识库,提高其在事实核查和信息搜索等应用中的性能;同时指出了敌对方如何通过向检索数据库注入虚假内容来更改模型行为,进而对 RAG 系统进行成功的攻击,为此呼吁在设计和部署 RAG 系统
→
PDF
8 days ago
大型语言模型对于生成有害内容的鱼目混珠攻击存在漏洞
通过诱饵和转换攻击,大型语言模型能够将安全文本转化为有害内容,这提醒我们在开发可靠的安全保护机制时需要考虑后续转换。
PDF
4 months ago
Prev
Next