ICLROct, 2020

InfoBERT: 从信息理论的角度提高语言模型的鲁棒性

TL;DR从信息论的角度出发,我们提出了 InfoBERT 框架来增强预训练语言模型的鲁棒性,包含两种基于相互信息的正则化器:信息瓶颈正则化器和鲁棒特征正则化器。实验证明,该方法在 NLI 和 QA 任务上取得了最先进的鲁棒性的结果。