协变量漂移下的一致性预测系统
本文提出拓展 Conformal Prediction 方法,可计算在测试和训练协变量分布不同的情况下的无分布预测区间,同时在数据满足一定加权交换性的情况下,拓展还可以应用于其他设置,如潜在变量和缺失数据问题。
Apr, 2019
通过使用物理信息的结构性因果模型 (PI-SCM) 来减小上界,我们验证了 PI-SCM 在置信水平和测试领域上对交通速度预测任务和多个真实世界数据集上的流行病传播任务的覆盖鲁棒性的提升。
Mar, 2024
我们开发了一种方法,用于生成预测集,其覆盖率在训练数据中存在缺失或噪声变量等损坏情况下是健壮的。我们的方法基于符合性预测,这是一种强大的框架,用于构建在独立同分布假设下有效的预测集。重要的是,简单地应用符合性预测在这种情况下不能提供可靠的预测,因为由损坏引起的分布偏移。为了考虑到分布偏移,我们假设可以访问特权信息(PI)。特权信息被形式化为解释分布偏移的附加特征,然而,它们仅在训练期间可用,在测试时不可用。我们通过引入一种新的加权符合性预测的广义方法来解决这个问题,并支持我们的方法具有理论上的覆盖率保证。在真实数据集和合成数据集上的实证实验表明,我们的方法实现了有效的覆盖率,并构建了比现有方法更具信息性的预测,这些方法不受理论保证支持。
Jun, 2024
通过两种新方法 ECP 和 EACP,根据基模型在未标记测试数据上的不确定性调整 CP 中的评分函数,从而仅使用测试域中的未标记数据改进 CP 生成的预测集的质量。通过对许多大规模数据集和神经网络架构进行广泛实验,我们展示了我们的方法相对于现有基准算法的持续改进,并几乎与监督算法的性能相匹配。
Jun, 2024
本文介绍了两个计算效率更高的一类回归问题的概率分布预测方法,分别为 “分裂式 conformal 预测系统” 和 “交叉式 conformal 预测系统”;前者更保证准确性,后者更具预测效率,但其有效性仅在排除过度随机化的情况下成立。
Nov, 2019
本论文将 CP 技术与经典算法稳定性界限相结合,提出了一种置信区间集合,可用单一模型拟合计算,并证明了该方法能够保证精度,避免了数据分割的需求,成功解决了传统方法无法处理连续未知变量 y_n+1 的瓶颈问题。
Dec, 2021
本文提出了一种自适应的线上学习方法 - 自适应符合推断方法,该方法结合了预测集和符合推断的思想,能够在任何黑箱模型中实现长时间内预期的覆盖概率,从而解决了数据变化扰动的问题。
Jun, 2021
我们通过对未知随机动力系统的单个时间相关数据轨迹进行风险控制预测集(RCPS)性能的研究,使用封锁技术展示了数据遵循渐进稳定性和收缩性动态时,RCPS 获得类似于独立同分布情况下的性能保证;接着,我们使用解耦技术来描述 RCPS 性能保证在数据生成过程偏离稳定性和收缩性时的优雅退化;最后,我们讨论这些工具如何用于统一在线和离线形式预测算法的分析,目前这些算法的分析工具差异较大。
Jun, 2024
本研究利用信息论来将符合预测与其他不确定性概念相联系,并证明了三种不同的方法来上界内在不确定性,同时通过符合预测和信息论不等式的组合,实现了两种直接有用的应用:(i)更规范和有效的符合训练目标,从头开始实现机器学习模型的端到端训练,(ii)将旁路信息纳入符合预测的自然机制。我们在集中式和联邦学习环境中进行了实证验证,并证明了我们的理论结果能够转化为流行的符合预测方法的低效性(平均预测集大小)。
May, 2024
非参数机器学习模型与符合预测是房地产市场数据中准确预测房屋价格的方法,但由于地理空间上的依赖,直接应用符合预测在不同地理区域的置信区间不完全校准。本研究调查了各种方法来调整符合预测的置信区间以解决此问题,并在挪威奥斯陆房地产市场数据集上验证其性能。研究结果表明,在非一致性分数的 extit {局部加权} 版本上校准置信区间可以在不同地理区域中一致地进行校准。我们还在合成生成的销售价格上进行了模拟研究,从而在已知数据生成机制的理想条件下实证探索符合预测在房地产市场数据上的性能。
Dec, 2023