Jun, 2020

Triple descent 和两种过拟合:何时何处出现?

TL;DR本文研究深度学习中的双下降现象,即当训练样本数 N 接近模型参数数 P 或者输入维度 D 时,神经网络的泛化误差会出现峰值,本文提供了理论解释,并探讨了非线性对此现象的影响及正则化方法的应用。