Aug, 2023

不要怪罪数据集偏移!梯度和交叉熵导致的快捷学习

TL;DR对于感知任务而言,默认的 ERM 的隐含归纳偏差偏向于最大化边界学习模型,该偏差通过鼓励均匀边界解决方案可以消除 shortcut 学习,并在视觉和语言任务中证明更好的归纳偏差可以消除费时的两阶段 shortcut 缓解方法。