May, 2023

IMBERT: 使 BERT 免受插入式后门攻击

TL;DR本文介绍了一种基于自我防御策略的解决方案 IMBERT,用于在推断时有效地识别和减少后门攻击的成功率, 特别针对自然语言处理应用中的后门攻击漏洞问题,并在多个预先训练的变压器模型上验证,取得了竞争性的准确性。