不确定性工具箱:一个用于评估、可视化和改善不确定性量化的开源库
该论文介绍了一个名为 Uncertainty Quantification 360 (UQ360) 的 Python 工具包,其目的在于量化、评估、改进和传达 AI 应用程序开发生命周期中的不确定性,并鼓励进一步探索 UQ 与其他可信 AI 支柱的联系,例如公平性和透明度。
Jun, 2021
本篇研究论文重点介绍了机器学习模型中的不确定性量化方法,特别关注神经网络以及在工程设计和医疗领域的应用。通过介绍多种不确定性量化方法和计量标准,本篇论文旨在帮助提高机器学习模型的安全性和可靠性,同时提供两个具体案例:锂离子电池寿命预测和涡轮发动机剩余使用寿命预测。
May, 2023
本文展示了不确定性包装器在医学领域中与可靠方法和透明不确定性量化相结合的机器学习模型的应用和实用价值,以流式细胞术作为一个示例。
Nov, 2023
本研究回顾了当前深度学习中不确定性量化(UQ)方法的最新进展,其应用于计算机视觉,医学图像分析,自然语言处理等领域,并调查了这些方法在强化学习中的应用。接着,我们概述了 UQ 方法的几个重要应用,并简要概述了 UQ 方法面临的基本研究挑战,讨论了未来在此领域的研究方向。
Nov, 2020
本文介绍了一个包含不确定性建模、解法和评估的完整框架,用于量化神经网络中包括噪声、有限数据、超参数、过度参数化、优化和采样误差及模型错误等多源的误差和不确定性,特别关注向无限维函数空间中的偏微分方程和操作映射的学习,包括一个在原型问题上进行的广泛的比较研究。
Jan, 2022
深度学习模型对交通预测的强大预测性能使其得到广泛应用,但缺乏可解释性限制了其在实际智能交通系统中的部署。通过使用不确定性量化方法,我们调查了这些方法在跨多个城市和时间段的大规模基于图像的交通数据集上的应用,以获得对现有不确定性方法在交通预测中的实用性以及不确定性与城市交通动态之间的关系的全面认识。在在时间和时空转移任务上比较了两种认知不确定性方法和两种他稳不确定性方法后,我们发现可以恢复有意义的不确定性估计。此外,我们进一步演示了如何利用不确定性估计来检测城市交通动态变化中的无监督异常点。通过对莫斯科市的代表性案例研究,我们发现我们的方法能够捕捉到交通行为的时间和空间效应。我们的工作是在交通预测任务中推动不确定性意识的进一步发展,并旨在突出不确定性量化方法对于更好理解城市交通动态的价值贡献。
Aug, 2023
本研究比较了多种机器学习技术的 UQ 准确性,并对两个模型(船只在波浪中的运动和 Majda-McLaughlin-Tabak 模型)进行了应用。
Jun, 2023
本文第一次对用于深度学习中不确定性估计的工具包进行梳理,比较了 11 种工具包的模型和评估能力,最终推荐了 Pyro、Tensorflow Probability 和 Uncertainty Quantification 360 三种最有前景的工具包,提出了在保障模型可信度和可复现性方面进一步统一评估和保障方法论的必要性。
May, 2022
近期,发展了一种针对多类别标注问题的不确定性感知深度学习方法,提供了校准的类别预测概率和超出分布的指示,从而使机器学习用户和工程师能够评估模型对其预测的信心。为了解决这些挑战,我们提出了 ScatterUQ,一个交互式系统,通过提供有针对性的可视化方式,使用户能够更好地理解模型在上下文驱动的不确定性环境中的性能。通过利用最近在距离感知神经网络和降维技术方面取得的进展,ScatterUQ 构建了强大的二维散点图,解释模型为什么将一个测试样例预测为(1)属于某个类别的内部分布中的样例,(2)属于某个类别的内部分布中的样例,但对类别不确定,以及(3)属于外部分布的样例。机器学习用户和工程师可以通过使用 “悬停回调” 来直观比较测试样本的显著特征与训练样本,以理解模型的不确定性性能,并决定后续行动。我们通过针对 Fashion-MNIST 训练的距离感知神经网络在 Fashion-MNIST(内部分布)和 MNIST 数字(外部分布)上进行多类别图像分类的案例和针对网络数据集的深度学习模型进行了验证。我们定量评估了降维技术以优化我们的上下文驱动 UQ 可视化。我们的结果表明,ScatterUQ 系统可以适用于任意的多类别数据集。我们的代码可以在此 https URL 上获得。
Aug, 2023
文章通过对 5 个基准数据集的系统评估,研究不同的不确定性量化方法在回归任务中的性能表现,发现没有一种方法完全优于其他方法,也没有一种特别可靠的错误排名。作者建议在已有的技术中进行选择。
May, 2020