Aug, 2024

聚焦于特定领域:针对预训练模型的学习优化器

TL;DR本研究解决了现有学习优化器在普适性上的不足,通过针对特定训练环境专门设计优化器,提出了一种新的优化技术,该技术能够根据基础优化器提供的更新方向,学习层特定的线性组合。在图像分类任务中,这种专门化优化器显著优于传统的优化方法,如Adam,并且在模型初始化、未见数据集和超出元训练范围的训练时长方面表现出强大的泛化能力。