May, 2024

神经网络训练中异常特征的理解和最小化

TL;DR深入研究在神经网络训练中为什么会出现异常特征(Outlier Features),如何最小化它们的影响,并提出了预防措施,包括量化指标、架构选择、信号传播控制等。