BriefGPT.xyz
Ask
alpha
关键词
embedding indistinguishability
搜索结果 - 1
TransTroj: 通过嵌入不可区分性实现对预训练模型的可迁移后门攻击
在这篇论文中,我们提出了一种新颖的可转移后门攻击,TransTroj,以同时实现功能保持、持久性和任务不可知性,将预训练模型(PTMs)中的后门注入到下游模型中,并通过优化触发器和受害 PTMs 来实现嵌入空间中的嵌入不可辨别性。实验结果表
→
PDF
5 months ago
Prev
Next