回归任务中的不确定性预测评估和校准
本文探讨贝叶斯方法在不确定性问题上的推理方法,提出一种简单有效的校准程序,可以保证在足够的数据下,任何回归算法都能够产生准确的校准不确定性估计,并应用于贝叶斯线性回归、前向和递归神经网络中,能够稳定输出准确的区间预测,并提高时间序列预测和基于模型的强化学习性能。
Jul, 2018
应用于自动驾驶和手术机器人等许多安全关键应用中,从对象检测模块获取预测不确定性以帮助支持安全决策是可取的。本文中我们介绍了一种方法用于解决单个对象定位任务的边界框的不确定性问题。我们使用现有技术来校准回归模型,实验表明所得出的校准模型得到了更可靠的不确定性估计。
Nov, 2018
本文提出了一种算法,用于校准模型预测并考虑协变量转移的情况,采用重要性加权法纠正训练分布与实际分布的差异,并通过领域适应的方法实现两个分布尽可能一致, 实证结果表明,该方法在存在协变量转移时优于现有的校准方法。
Feb, 2020
该研究提出了一种用于回归设置的校准方法,称为经验性地校准回归不确定性分布(CRUDE),该方法不假定错误的特定不确定性分布,并展示了它的理论联系以及 CRUDE 的性能优于现有技术。
May, 2020
在安全关键应用的不确定性量化和决策中,概率模型的校准至关重要,在存在最小协变量转移时,针对校准的问题已受到广泛研究,我们提出了一种基于重要性采样的方法来解决这个问题,并在真实数据集和合成数据集上评估和讨论了我们的方法的有效性。
Jun, 2020
我们提出了一种基于几何的方法来估计不确定性,它可通过后处理模型校准来实现,避免了重新训练和更改模型,经多个数据集和模型的详细评估显示出更好的不确定性估计,并且可在接近实时应用中使用。
Jun, 2022
在部署机器人或其他物理系统上的深度神经网络时,可靠地量化预测不确定性以允许下游模块对其行为的安全性进行推理至关重要。本文研究了评估这种不确定性的度量标准,具体关注回归任务,并调查了 Sparsification Error 下面积 (AUSE)、校准误差、Spearman 排名相关性和负对数似然度量。通过使用合成回归数据集,我们研究了这些度量标准在四种典型的不确定性下的行为方式,以及它们对测试集大小的稳定性,并揭示了它们的优势和劣势。结果表明,校准误差是最稳定和可解释性的度量标准,但是 AUSE 和负对数似然度量也有各自的适用场景。我们不建议使用 Spearman 排名相关性来评估不确定性,建议用 AUSE 替代。
May, 2024