Feb, 2023

早期训练动态视角下的快捷学习

TL;DR本文通过观察 Deep Neural Networks (DNNs) 内部神经元的学习动态,提出了易学特征会导致 Shortcut Learning 的假设,并用实验验证了此假设。文章主张在早期的训练动态中监测模型的表现而非仅仅监测模型准确率。