ACLJun, 2024

条件信息流最大化的表示学习

TL;DR本论文提出了一个名为条件信息流最大化的信息论表示学习框架,用于提取输入数据和目标任务的噪声不变的充分表示。该方法通过最大化输入 - 表示和表示 - 标签互信息,同时促进学习到的表示具有较好的特征一致性和充分的预测能力,从而增强了预训练语言模型在目标任务中的泛化能力。实验证明,该方法有效地提升了用于分类和回归的预训练语言模型的性能,并且学到的表示更加充分、鲁棒和可迁移。