Oct, 2022

重新思考特洛伊木马触发器的逆向工程

TL;DR本文研究发现特征空间平面与输入空间约束都涉及特征空间 Trojans, 并利用这一发现设计了新的逆向工程方法来防卫其攻击。结果表明,该方法在 Trojan 模型检测和缓解任务方面都比现有的逆向工程方法和其他防御类型表现更好,平均检测精度达到 93%,缓解成功率可降低到 0.26%,无害精度几乎不变。