Oct, 2023

关于在具有高度区分特征的数据上微调的后果

TL;DR在迁移学习时代,从头开始训练神经网络已经过时。迁移学习利用先前的知识进行新任务训练,节省计算资源。然而,我们发现一个显著的缺点:网络倾向于优先考虑基本的数据模式,而忽视宝贵的预先学习特征。我们将这种行为称为 “特征侵蚀”,并分析其对网络性能和内部表示的影响。