多用户环境中的符合性预测评估

Dec, 2023

Conformal Prediction in Multi-User Settings: An Evaluation

Enrique Garcia-Ceja, Luciano Garcia-Banuelos, Nicolas Jourdan

TL;DR在多用户设置中，我们评估了共形预测框架，并通过使用不同的评估策略进行了大量实验，发现在共形性能指标方面存在显著差异。同时，我们提出了基于矩阵、图表和图形的多个可视化方法来捕捉预测集的不同方面。

Abstract

Typically, machine learning models are trained and evaluated without making any distinction between users (e.g, using traditional hold-out and cross-validation). However, this produces inaccurate performance metrics estimates in →

machine learning models multi-user settings model evaluation strategies conformal prediction framework performance measures

发现论文，激发创造

共形在线模型聚合

这篇论文介绍了一种在在线环境中通过投票将多个算法的预测集合结合起来的方法，从而解决了在 conformal prediction 中的模型选择和 / 或聚合问题。

Mar, 2024

多视角一致性学习用于异质传感器融合

为了评估机器学习模型单个预测的可信度，我们建立和测试了多视角和单视角的异构传感器融合的模型，这些模型基于相合预测框架，提供了理论上的边际置信保证。通过全面实验，我们证明了多视角模型不仅在准确性性能度量方面（已在多个之前的工作中显示），而且在提供不确定性估计的相合度量方面，比单视角模型表现更好。

Feb, 2024

机器学习中有效不确定性量化的共形预测方法的比较研究

过去几十年，数据分析和机器学习领域的大部分工作都致力于优化预测模型，并取得比现有模型更好的结果。然而，本文指出对于很多应用而言，更加重要的并非准确的预测，而是变异性或不确定性。本文进一步探讨了让每个人了解不确定性、意识到其重要性并学会拥抱而不是害怕不确定性的世界，对一种确定性估计准确性的具体框架 —— 被称为 “符合性预测” 的框架进行了细致研究。而且，无需对数据进行参数假设，这一非参数结果在渐近程度上也不必依赖大数定律，使得这个框架成为唯一值得称为 “无分布假设” 的框架。

May, 2024

机器翻译评估的共形化

本文研究机器翻译的不确定性评估方法，发现目前大多数方法对模型不确定性的估计较低，建议采用分布自由的合规预测法来保证覆盖度，并提出条件合规预测技术来获得每个数据子组的校准子集，从而实现覆盖率均衡。

Jun, 2023

基于一致预测集的人类决策改善

在这项研究中，我们通过进行一项预先注册的随机对照试验，提供给人类被试一些确定度集合，从而研究了确定度集合对人类决策的辅助作用。结果表明，使用确定度集合来量化模型的不确定性对于人机合作决策和人工智能团队非常有帮助。

Jan, 2024

超越交换性的合拍预测

本文提出一种新的针对预测模型的 Conformal prediction 泛化方法，通过引入加权分位数来抵御数据分布漂移的影响，同时设计一种新的随机化技术，允许不对称处理数据点的算法。实验表明，该方法在数据点不可交换的情况下具有较高的鲁棒性，并且在数据点可交换情况下达到了与现有方法相同的覆盖率保证。

Feb, 2022

基于置信区间预测的无分布式偏差联邦学习

该研究提出将自适应拟合框架结合到联邦学习中，确保预测集的分布自由且提供覆盖担保，可在不需要对模型进行任何其他修改的情况下获得不确定性估计，实验证明本方法在医学影像分类任务中取得了更佳的覆盖度。

Oct, 2021

一个温和的介绍：拟合预测及无分布不确定性量化

介绍一种无需分布假设或模型假设，可用于任何预训练模型（如神经网络）生成 100% 正确性置信区间（信赖区间）的方法，称之为一致预测；并提供了 Python 示例代码和 Jupyter 笔记本来说明此方法在计算机视觉、自然语言处理和深度强化学习等领域上的应用。

Jul, 2021

对于任何数据分布，存在一致有效性保证

机器学习系统中风险量化与控制的研究，集中在处理 ML 系统收集自身数据时产生的数据分布变化问题，通过扩展 conformal prediction 理论以适应任意数据分布，并提出了针对特定数据分布的可行算法，以解决这一挑战。

May, 2024

自然语言处理的保形预测：一项概述调查

快速增长的大型语言模型和自然语言处理（NLP）应用对不确定性量化提出了关键需求，以减轻幻象等风险并提高关键应用中的决策可靠性。条件预测正在成为一个理论上健全且实用的框架，结合了灵活性和强有力的统计保证。它的模型无关性和无分布性质使其特别有希望解决源于 NLP 系统缺乏不确定性量化的现有缺点。本文对条件预测技术、其保证以及 NLP 中的现有应用进行了全面调研，指出了未来研究的方向和面临的挑战。

May, 2024