置信度预测中的长度优化
探究贝叶斯岭回归在满足标准贝叶斯假设的情况下,与等效算法相比,异步共形预测集有效性的要求是否被满足。结果显示,在这种情况下,渐近共形预测集与岭回归预测区间的差异很小。
Apr, 2014
本文介绍一种基于分位数回归和树状结构分类器的符合性预测方法,可以有效解决多分类和多标签问题中难易样本分布不均匀、信心区间过大等挑战,且可以和任何分类模型结合使用并保证有效性。
Apr, 2020
该研究提出了一种新颖的conformal prediction(CP)方法,通过找到一组有前途的预测候选项而不是单个预测,以适合许多开放式分类任务,实现包含正确答案的高概率且适用于自然语言处理和药物发现等多个应用领域,同时实现降低预测集的大小和费用摊销等效果。
Jul, 2020
本文提出了一种广义的拟合的预测集来解决多可学习参数,通过考虑找到最有效的预测集的约束经验风险最小化问题,从而实现有效的经验覆盖。同时,本文还开发了一种基于梯度的算法来优化这个ERM问题以近似有效的覆盖和最优效率。
Feb, 2022
本文旨在解决当前对于确保错误频率的合规性统计保证,且相应预测集的大小对其实用性至关重要,但预测集大小缺乏有限样本分析和保证的问题,通过量化拆分一致性预测框架下预测集的期望大小来解决此不足,并提供一种实用的方法来表示测试和校准数据的不同可能实现的预期预测集大小。实验结果表明,对于回归和分类问题的现实世界数据集,本文的结果的功效得到了验证。
Jun, 2023
通过建立基础预测器的泛化性能与条件概率预测集成信息量之间的理论连接,本研究推导了一个上界,以便理解条件概率预测集的平均大小对校准数据量、目标可靠性和基础预测器的泛化性能的依赖关系。通过简单的数值回归和分类任务验证了理论洞察的有效性。
Jan, 2024
本文关注条件保证的合拟合预测问题,并提出了采用从校准数据中学习的不确定性引导特征来改进预测集的条件有效性的分区学习合拟合预测(PLCP)框架。我们在理论上分析了PLCP,并对无限和有限样本大小提供了条件保证。最后,我们在四个真实世界和人工合成数据集上的实验证明了PLCP在分类和回归场景中相对于最先进方法在覆盖率和长度方面的卓越表现。
Apr, 2024
我们开发了一种新方法来创建预测集,它结合了符合性方法的灵活性和条件分布P(Y | X)的估计。我们的方法扩展了现有方法,实现了条件覆盖,这对许多实际应用至关重要。我们提供了非渐近界限,明确依赖于对条件分布的可用估计的质量,使得我们的置信集在数据的局部结构上高度自适应,特别适用于高异方差情况。通过广泛的模拟,我们证明了我们的方法的有效性,显示其在条件覆盖和统计推断的可靠性方面优于现有方法,在各种应用中提高了统计推断的可靠性。
Jul, 2024
本研究解决了在复杂分布和有限样本情况下,概率顺应预测(PCP)覆盖效率不足的问题。作者提出了一种新颖的PCP框架,通过向量化非顺应性分数并优化预测集形状,显著提高了效率。实验表明,该方法在合成和真实数据集上均表现出色,尤其适合高风险应用。
Oct, 2024