Jun, 2021

提前停止的神经网络具有一致性

TL;DR研究使用逻辑损失的梯度下降训练 ReLU 网络在二元分类数据上的行为,证明通过提前停止的梯度下降可以在总体风险上接近最优,并获得概率校准。