ICLRJun, 2021

有效低资源微调的变分信息瓶颈

TL;DR本文提出使用变分信息瓶颈 (VIB) 来压制过拟合和提高低资源情景中的传输学习,并证明我们的方法成功地降低了过拟合,提高了泛化能力。我们的 VIB 模型发现的句子表示更加鲁棒且能够在自然语言推断数据集中更好地泛化到领域外数据集,实验结果表明我们的方法显著提高了传输学习,并在 13 个领域外自然语言推断基准测试中提高了泛化能力。