非一致性功能及数据集难度对符合性分类器效率的影响
通过引入 Penalized Inverse Probability (PIP) 和其正则化版本 RePIP 的非共形评分方式,该研究提出了一种可以同时优化效率和信息性的算法,通过农业机器人中作物和杂草图像分类任务的玩具示例和实证结果,展示了 PIP-based 共形分类器与其他非共形评分方式相比所表现出的预期行为,并在信息性和效率之间找到了良好的平衡。
Jun, 2024
本文研究了使用最大预测效率作为优化目标训练归纳一致预测器(inductive conformal predictor)的方法,将对可用于分类的归纳一致预测器进行了特别关注,并在几个真实数据集上进行了测试,结果表明该方法在大多数情况下相对于基线一致预测器具有更高的预测效率。
May, 2021
本文提出了一种广义的拟合的预测集来解决多可学习参数,通过考虑找到最有效的预测集的约束经验风险最小化问题,从而实现有效的经验覆盖。同时,本文还开发了一种基于梯度的算法来优化这个 ERM 问题以近似有效的覆盖和最优效率。
Feb, 2022
本文在一极化模型下研究了各种标准的最优符合度量,提出了一个重要的效率准则类别 —— 概率,结果发现除非分类问题是二元的,否则文献中最常用的效率准则不是概率性的;本文同时考虑了无条件和标签条件下的符合性预测。
Mar, 2016
本论文提出一种非交换可行的符号风险控制框架,用于控制数据不可交换情况下的任意单调损失函数的期望值,并通过在测试示例中基于其统计相似性的权重选择,使得我们的框架在存在变化点、时间序列或其他形式的分布漂移时更有用。实验表明我们的方法的实用性。
Oct, 2023
过去几十年,数据分析和机器学习领域的大部分工作都致力于优化预测模型,并取得比现有模型更好的结果。然而,本文指出对于很多应用而言,更加重要的并非准确的预测,而是变异性或不确定性。本文进一步探讨了让每个人了解不确定性、意识到其重要性并学会拥抱而不是害怕不确定性的世界,对一种确定性估计准确性的具体框架 —— 被称为 “符合性预测” 的框架进行了细致研究。而且,无需对数据进行参数假设,这一非参数结果在渐近程度上也不必依赖大数定律,使得这个框架成为唯一值得称为 “无分布假设” 的框架。
May, 2024
通过优化参数化形状模板函数的方法,我们提出了一种能够产生多模态预测区域的非一致性评分函数,使得每个区域是凸的、易于在后续任务中引入的实用预测区域,主要适用于监督学习任务,本研究以时间序列预测为例,可应用于 F16 战斗机和自动驾驶车辆等案例研究,预测区域面积可减少高达 68%。
Dec, 2023
本文提出一种新的针对预测模型的 Conformal prediction 泛化方法,通过引入加权分位数来抵御数据分布漂移的影响,同时设计一种新的随机化技术,允许不对称处理数据点的算法。实验表明,该方法在数据点不可交换的情况下具有较高的鲁棒性,并且在数据点可交换情况下达到了与现有方法相同的覆盖率保证。
Feb, 2022
本研究探究了针对标签噪声的确定性估计方法 ——“conformal prediction” 的鲁棒性。通过理论证明和实验验证,提出了对于正确覆盖未观测噪声的基准真实标签,构建正确的不确定性集合的可能性和条件,并发现除了在数据分布或噪声源方面存在病态的特殊情况外,纠正标签噪声并不必要。在这种情况下,可以在确定性预测算法中纠正有界大小的噪声以确保正确覆盖基准真实标签,而无需直接调整得分或数据稳定性。
Sep, 2022