BriefGPT.xyz
Ask
alpha
关键词
llamos
搜索结果 - 1
大型语言模型哨兵:通过 LLM 代理推进对抗鲁棒性
我们引入了一种名为 LLAMOS 的新型防御技术,通过净化输入到目标大型语言模型之前的对抗文本示例,以增强大型语言模型的对抗鲁棒性。我们的方法包括两个主要组成部分:a) 代理指示,可以模拟新的代理进行对抗防御,通过最小限度地更改字符来保持句
→
PDF
a month ago
Prev
Next