Nov, 2022

对大幅扰动输入进行惩罚并不提高问答任务中对分布外泛化的能力

TL;DR针对问题回答模型在面对大幅扰动时仍能自信地给出正确答案但无法泛化到其他领域和对抗测试集的问题,本文提出通过限制多种扰动类型的模型输出熵提高泛化性能的做法,结果表明模型泛化能力随着扰动限制的增加得到一定的提升,但同时也要注意到熵最大化的副作用。