- 置信度预测中的长度优化
研究发展了一种新颖的基于长度优化的一致性预测框架(CPL),能够在不同类别的协变量转移下确保条件有效性,并构建出(接近)最优长度的预测集合,通过广泛的实证评估验证了其在分类、回归和文本相关设置方面相较于最新方法在预测集大小性能方面的优越性。
- 研究感应阵预测模型中的数据使用
本研究通过多个实验证明了在有限或昂贵的开发数据情况下,允许训练集和校准集之间的示例重叠是一种高效的方式,从而提供了关于使用 ICPs 的价值的结论。
- 基于预测集的决策支持系统中的反事实伤害控制
基于预测集的决策支持系统通过缩小潜在标签值的集合(即预测集),并要求用户始终从预测集中预测标签值,来帮助人们解决多类别分类任务。本文的目标是通过设计控制决策支持系统频繁造成伤害的系统。通过结构性因果模型的理论框架来对伤害概念进行特征化,并在 - 利用特权信息的健壮合拢预测
我们开发了一种方法,用于生成预测集,其覆盖率在训练数据中存在缺失或噪声变量等损坏情况下是健壮的。我们的方法基于符合性预测,这是一种强大的框架,用于构建在独立同分布假设下有效的预测集。重要的是,简单地应用符合性预测在这种情况下不能提供可靠的预 - 迈向人工智能与人类互补性的预测集
采用贪婪算法,该论文发现了一种可比或更好性能的预测集构造方法,该方法能帮助基于预测集的决策支持系统有效解决分类任务。
- 适应性选组等覆盖的共形分类
引入了一种符合性推断方法以评估分类中的不确定性,通过生成具有有效覆盖率的预测集,并在自适应选择的特征上进行。这些特征经过精选以反映潜在的模型限制或偏差,有助于在提供有信息的预测的同时,在最敏感的群体中确保平等的覆盖率,从而找到实践上的一个妥 - 置信度校准对符合性预测是否有帮助?
该研究论文研究了适用于高概率包含真实标签的预测集的不确定性量化技术 - 保形预测。通过实验证明,使用事后校准方法和较小的温度得到的预测集有改进校准,而事后校准方法和较大的温度得到的预测集有改进保形预测性能。论文提出了一种新的 $ extbf - 标签转移下的 PAC 预测集
使用一种新颖的算法,在标签偏移情境下构建具有 PAC 保证的预测集合,通过对目标领域的类别的预测概率和混淆矩阵进行估计,利用高斯消元算法传播这些估计的不确定性,计算重要性权重的置信区间,并利用这些区间构建预测集合。在几个基准数据集上评估我们 - 黎曼流形回归的共形推断
这项研究通过在流形上进行回归、流形统计学等探究,提出了一种在响应变量位于流形、协变量位于欧几里得空间情况下的回归预测方法,该方法基于非参数的分布自由概念,通过证明流形上经验预测区域与总体预测区域近似几乎必然收敛来展示其高效性。通过综合模拟研 - 共形语言建模
该研究介绍了一种新的适用于生成式语言模型的公差预测方法,它不仅能够精确地预测结果,还具有统计学的可靠性。研究者们通过校准样本输出和严格限制机制来实现这种方法。
- 通过强适应在线学习改进在线置信预测
研究在线情况下的不确定性量化问题,提出新的自适应后悔最小化算法用于在线共形预测,证明了该方法实现了近似最优的自适应后悔和适当的预测覆盖,同时在时间序列预测和图像分类等实际任务上对现有方法具有明显的优势。
- ICLR具有通用函数类的高效可微形预测
本文提出了一种广义的拟合的预测集来解决多可学习参数,通过考虑找到最有效的预测集的约束经验风险最小化问题,从而实现有效的经验覆盖。同时,本文还开发了一种基于梯度的算法来优化这个 ERM 问题以近似有效的覆盖和最优效率。
- 分布偏移下的自适应符合推断
本文提出了一种自适应的线上学习方法 - 自适应符合推断方法,该方法结合了预测集和符合推断的思想,能够在任何黑箱模型中实现长时间内预期的覆盖概率,从而解决了数据变化扰动的问题。
- 使用梯度下降逼近优化的拟合分类
本文研究了使用最大预测效率作为优化目标训练归纳一致预测器(inductive conformal predictor)的方法,将对可用于分类的归纳一致预测器进行了特别关注,并在几个真实数据集上进行了测试,结果表明该方法在大多数情况下相对于基 - 稳健验证:即使分布发生偏移,也能自信地做出预测
本文提出了一种建立在鲁棒性预测推断上的不确定性估计模型,使用 conformal inference 方法建立了准确覆盖测试数据分布的预测集,通过估计数据漂移量建立了鲁棒性,并在多个基准数据集上进行了实验证明了该方法的重要性。
- 无分布假设的二分类:预测集,置信区间和校准
研究数据无任何分布性假设条件下,针对二分类问题的不确定性量化中的三种方法 —— 标定、置信区间和预测集,建立了连接这三个概念的三角脚架,明确了使用基于评分函数的分类器才能进行无分布标定的必要条件。我们还推导了面向固定宽度和统一质量分组的二分 - 具有有效和自适应覆盖范围的分类
本文提出了新型一致性得分,结合适用于分类问题的定制化 Conformal inference、交叉验证、Jackknife 等方法,在保证边际覆盖率的前提下,也可以应对复杂的数据分布,其在合成数据和真实数据上获得实际价值和统计优势。