倾斜与平均:最后一层的几何调整用于重新校准
提出了一种类别自适应标签平滑方法(CALS),在训练过程中允许学习班级特定的乘数,通过在大规模的自适应训练中引入几种修改以量身定制它,以校准深度神经网络,综合评估和多重比较展示了所提出方法的优越性
Nov, 2022
本文提出了一种新的评估指标,称为 “field-level calibration error”,用于衡量决策者关注的敏感输入领域中预测偏差,提出了一种名为神经校准的后续校准方法,使用验证集中的领域感知信息进行校准,并通过实验证明其对常见度量(如负对数似然、布里尔分数和 AUC)以及所提出的 “field-level calibration error” 指标的校准性能得到了显著提高。
May, 2019
本文研究了神经网络模型的预测不确定性及其校准问题,并发现不使用卷积层的最新模型的校准性能最好,模型大小和预训练量并不能完全解释这些差异,表明模型架构是影响校准性能的主要因素。
Jun, 2021
本文提出了一种新的校准方法,旨在提高神经网络在医学领域图像分类任务中的不确定性量化能力,该方法基于期望校准误差作为量化神经网络不确定性的公共度量,可以作为辅助损失项轻松地集成到任何分类任务中,从而显著降低分类误差。
Sep, 2020
本文研究了分类网络在面对数据异常和对抗攻击时准确性和可校准概率分布的平衡,在探讨标签平滑正则化和标准化方法对数据泛化性和校准概率分布的影响时提出了正则化软标签的方法,将传统卷积转化为基于填充的局部卷积,以加强性能和收敛速率。
Dec, 2020
我们提出了一种使用人工神经网络隐藏层提供的输入的降维表示进行局部重新校准的人工神经网络预测分布方法,通过仿真研究证明了我们的方法相对于其他方法具有良好的性能,并探索了基于网络的不同层进行校准定位的益处。最后,我们将我们提出的方法应用于钻石价格预测问题,证明了我们的方法在现实世界应用中提高预测和不确定性量化的潜力。
Mar, 2024
该论文研究了神经网络中置信度校准的问题,并提供了校准方法的经验比较,分析了可视化和标量测量评估模型置信度校准的不同方法,并对基于后处理或对训练进行更改的现代校准技术进行了评估,实验结果覆盖了各种数据集和模型,比较了不同标准下的校准方法。
Mar, 2023
本文探讨了机器学习分类器中出现的过度置信和欠置信问题,介绍了衡量分类器置信度的度量标准 —— 准确率校准度,以及该度量标准不足的缺点;进而进行了一项全面的实证研究,并开源了一种度量方法的库。实证研究发现,不同的度量标准对于分类器校准度的优化与评价可能会带来截然不同的结论。
Apr, 2019