BriefGPT.xyz
Ask
alpha
关键词
invisible backdoors
搜索结果 - 2
ACL
可学习的文本后门攻击:基于词替换的组合锁攻击
本文研究表明神经自然语言处理模型容易受到后门攻击的威胁,而现有文本后门攻击方法容易被检测和阻拦,因此我们提出一种使用可学习的词汇替换的不可见后门攻击方法,结果表明该方法在攻击成功率接近 100% 的情况下高度隐蔽,对于 NLP 模型的安全构
→
PDF
3 years ago
通过隐写和正则化对深度神经网络进行不可见的后门攻击
该论文通过在深度神经网络中嵌入不可察觉的触发器,实现了一种无形的后门攻击,旨在欺骗模型产生意外行为,同时提出了两种评估指标,评估攻击成功率、功能性和不可见性,并证明此方法可以有效地防范目前最先进的后门检测方法,例如神经网络清理和 TABOR
→
PDF
5 years ago
Prev
Next