Feb, 2022

关于 “通过差异性评估 SGD 的泛化能力” 注释

TL;DR本文介绍了深度神经网络的预测误差可以通过模型的预测不一致性进行估计,其中,“广义差异等式” 遵循了深度集合的良好校准性,并提出了 “类别聚合校准” 的概念。但我们发现该理论可能不实用,因为预测不一致性增加时,深度集合的校准性可能会降低,并需要标签来估计新数据集上的校准性。我们简化了理论陈述和证明,并在概率上下文中展示它们是简单明了的。