EMNLPOct, 2022
ADDMU: 利用数据和模型不确定性估计检测远端边界对抗样本
ADDMU: Detection of Far-Boundary Adversarial Examples with Data and Model Uncertainty Estimation
Fan Yin, Yao Li, Cho-Jui Hsieh, Kai-Wei Chang
TL;DR提出了一种新的技术 ADDMU 来检测自然语言处理中的对抗性样本, 结合两种不确定性估计的方法可以更好的识别对抗性例子并提高模型的鲁棒性。