Apr, 2024

IMO: 基于贪心逐层稀疏表示学习的预训练模型用于超出分布的文本分类

TL;DR该研究关注域泛化的特定问题,通过学习不变特征,提出了IMO:用于超出领域文本分类的不变特征掩码,来实现域外泛化;此外,IMO还具有注意力模块,用于关注对预测有用的令牌。综合实验证明,IMO在各种评估指标和设置方面显著优于强基准算法。