Oct, 2024

朝着强健的分布外泛化:数据增强与神经架构搜索方法

TL;DR本研究针对深度学习在处理分布外数据时性能下降的问题,提出了一种新颖的特征去耦合方法,以减少非关键特征之间的虚假相关性,通过正交化类别和背景损失的梯度来实现。此外,研究还优化了神经架构搜索技术,以发现对分布外泛化性能优良的网络架构。结果表明,该方法在不同的分布变化下具有良好的泛化能力。