Jul, 2018

深度神经网络测试表现预测的惊人线性关系

TL;DR通过在预训练阶段使用不同程度的 “腐败” 数据或使用不同高斯标准偏差的权重初始化网络,利用交叉熵损失可以使网络产生不同的泛化效果。通过去除交叉熵损失中不涉及期望分类性能的成分,可以建立训练误差和测试误差之间的线性关系,而分类错误与规范化交叉熵损失之间的经验关系似乎是近似单调的。