BriefGPT.xyz
Ask
alpha
关键词
content injection
搜索结果 - 1
指令调整的可利用性
介绍了一种名为 AutoPoisin 的自动数据污染技术,可通过注入恶意训练数据使语言模型出现漏洞,并展示了其中的两种攻击:内容注入和过度拒绝攻击。
PDF
a year ago
Prev
Next