增强标签排序校准的适用于每类覆盖的合拢预测
本文介绍一种基于分位数回归和树状结构分类器的符合性预测方法,可以有效解决多分类和多标签问题中难易样本分布不均匀、信心区间过大等挑战,且可以和任何分类模型结合使用并保证有效性。
Apr, 2020
该研究提出了两种技术,一种是简化校准方法,将原问题转化为更简单的问题,并使用非参数重新校准方法进行解决,另一种是基于神经崩溃现象和大多数精确分类器可以被认为是K个不同函数的组合的观察来提出针对每个类别独立重新校准的方法。将这两种方法应用在一起可以减少预测和每个类别的校准误差。
Oct, 2022
本研究提出了一种名为邻域适应序列预测(NCP)的新算法,通过利用神经网络的学习表示来识别给定测试输入的k个最近邻校准样例,并根据它们的距离分配重要性权重,创建自适应预测集,从而提高使用CP进行深度分类器的不确定性量化的效率。
Mar, 2023
本文提出了一种称为聚类置信预测的方法,该方法通过聚类类,将具有“相似”信心得分的类聚合在一起,然后在聚类水平上执行置信预测,进行分类问题中的更强的置信度验证, 应用于多分类图像数据集中表现更加优秀。
Jun, 2023
概率鲁棒性调和的效果超过了标准的鲁棒性分类器和对抗性鲁棒性分类器,通过提供候选标签预测集合并对数据和扰动设定两个平行阈值,将概率鲁棒性调和引入到机器学习的不确定性量化框架中。
Jul, 2023
该研究开发了新的遵循性预测方法,用于分类任务,可以自动适应标签污染,实现比现有方法更具信息量的预测集,并提供更强的覆盖保证。通过对标签污染下标准遵循性推断所面临的准确理论特征进行精确刻画,并通过新的校准算法实施行动。我们的解决方法灵活,并且可以利用关于标签污染过程的不同建模假设,同时无需关于数据分布或机器学习分类器内部工作的任何知识。通过广泛的模拟实验和对CIFAR-10H图像数据集的对象分类应用来证明了所提出方法的优势。
Sep, 2023
本文关注条件保证的合拟合预测问题,并提出了采用从校准数据中学习的不确定性引导特征来改进预测集的条件有效性的分区学习合拟合预测(PLCP)框架。我们在理论上分析了PLCP,并对无限和有限样本大小提供了条件保证。最后,我们在四个真实世界和人工合成数据集上的实验证明了PLCP在分类和回归场景中相对于最先进方法在覆盖率和长度方面的卓越表现。
Apr, 2024
通过在设定的概率内构建小的预测集合,拟合预测集合可量化网络不确定性。本研究针对带有噪声标签的校准问题,引入了一种对标签噪声具有鲁棒性的拟合得分。通过使用带有噪声标签的数据和噪声水平估算出无噪声的拟合得分,并在测试阶段使用该得分形成预测集合。我们将该算法应用于几个标准医学图像分类数据集,发现我们的方法在预测集合的平均大小方面明显优于当前方法,同时保持所需的覆盖率。
May, 2024
研究发展了一种新颖的基于长度优化的一致性预测框架(CPL),能够在不同类别的协变量转移下确保条件有效性,并构建出(接近)最优长度的预测集合,通过广泛的实证评估验证了其在分类、回归和文本相关设置方面相较于最新方法在预测集大小性能方面的优越性。
Jun, 2024
通过使用适用于对标签顺序进行正确预测的分类模型的排名式评分函数,我们提出了一种新颖的符合性预测方法,该方法能够预测一组可能的标签,并获得相应的置信度得分以捕捉不确定性。我们的方法构建了在实现期望覆盖率的同时管理其大小的预测集合,通过对底层分类器的排名分布进行理论分析,我们提供了符合性预测集合的预期大小的理论分析。通过广泛的实验证明了我们的方法在各种数据集上优于现有技术,提供了可靠的不确定性量化。本文的贡献包括一种新颖的符合性预测方法、理论分析和实证评估,通过实现可靠的不确定性量化,推动了机器学习系统的实际部署。
Jul, 2024