ACLOct, 2021

SEPP: 针对对抗文本的防御和检测中的预测概率相似度估计

TL;DR该论文提出了一种基于相似度估计的预测概率的集成模型 (SEPP),用于纠正分类器对误分类文本的不正确预测,并展示了该模型在不同类型的受害者分类器、分类任务和对抗攻击中识别和捍卫信息安全的鲁棒性。