Nov, 2022

MSDT: 文本领域中的掩码语言模型评分防御

TL;DR这篇论文提出了一种名为 MSDT 的新型文本后门防御方法,该方法在特定数据集上的性能优于现有的防御算法,实验证明在文本域中有效地防御后门攻击。