EMNLPOct, 2021
两个简单技巧使得文本后门攻击更加有害
Textual Backdoor Attacks Can Be More Harmful via Two Simple Tricks
Yangyi Chen, Fanchao Qi, Hongcheng Gao, Zhiyuan Liu, Maosong Sun
TL;DR本文针对深度学习领域的后门攻击进行研究,通过添加训练任务以区分被污染数据和干净数据,以及使用原有的干净数据进行攻击,提高攻击效果,并在三种场景下进行了实验验证。