EMNLPOct, 2023

增强注意力的背门攻击对基于 BERT 模型的影响

TL;DR通过直接操纵注意力模式,我们提出了一种新颖的特洛伊注意力损失(TAL),以增强特洛伊行为,并提高攻击成功率和污染率,不仅适用于传统的脏标签攻击,还适用于更具挑战性的干净标签攻击。