NIPSFeb, 2018

损失曲面、模式连通性和 DNN 的快速集成

TL;DR本研究利用一种新的几何洞见发现了深度神经网络损失函数的凸性及优化过程中损失函数可达到极值的简单曲线,提出了一种利用此洞见的训练方法,并提出了一种名为快速几何融合(FGE)的新的集成方法,在 CIFAR-10、CIFAR-100 和 ImageNet 三个数据集上,与最新的快照集成法相比取得了更好的性能。