ACLMay, 2022

木马 Bert 中的关注异常研究

TL;DR本文提出了一种基于 transformer 注意机制的 Trojan 检测器,探究了 Trojan BERT 模型的机制,发现了 Trojan 模型注视焦点漂移的行为。