本篇论文研究了四种主要的适用于生存分析中的严格得分规则推广,并且证明了这些扩展在离散化条件下是适当的,并通过真实数据集比较了这些扩展得分规则的估计性能,发现对数分值和布赖尔分值的扩展效果最好。
May, 2023
该文研究了几种评分规则,以便为概率预测模型评分或估计模型参数。研究发现,采用对数评分规则以在更不确定的情况下犯错为优势,采用球形评分规则则以在较低不确定性下犯错为优势,而其他评分规则则对两种选择都不关心。
Dec, 2011
本文介绍了 R 包中基于适当的评分规则进行概率模型比较评估的功能,涵盖了应用工作中的各种情况,并且提供气象和经济方面的案例研究和相关文献的指向。
Sep, 2017
本研究提出了一种新的评估概率预测效果的方法,该方法利用损失函数以及马氏理论来评估预测结果与实际情况之间的关系。
Feb, 2012
生存分析提供了关于各个领域中部分不完整的事件发生时间数据的关键洞察。它也是概率机器学习的一个重要示例。我们的提案以一种通用的方式利用了预测的概率特性,使用(适当的)评分规则而不是基于似然的优化来进行模型拟合过程。我们建立了不同的参数和非参数子框架,允许不同程度的灵活性。结合神经网络,它导致了一种计算高效和可扩展的优化程序,产生了最先进的预测性能。最后,我们展示了使用我们的框架,我们能够恢复各种参数模型,并证明在与基于似然方法相比时,优化同样有效。
Mar, 2024
提出了基于合适评分规则(proper scoring rules)的新的测量方法,用于量化机器学习中的系统不确定性和认知不确定性,建立了不同不确定性表示之间的联系,并引入了新的认知和系统不确定性度量。
Apr, 2024
区分预测不确定性的来源对于在各个领域中应用预测模型至关重要。本研究提出了一个基于统计推理的通用框架,不仅可以创建新的不确定性度量,还可以澄清它们之间的关系。我们的方法利用统计风险区分了随机不确定性和认知不确定性,并利用适当的得分规则进行量化。为了使其在实践中可行,我们提出了将贝叶斯推理纳入该框架的思路,并讨论了该近似方法的性质。
Feb, 2024
提出了一种方法,可以一致且渐近无偏地估计所有适当的校准误差和改进术语,并验证了所提估计器的所述特性,并建议后续校准方法的选择应由所关注的特定校准误差决定。
Dec, 2023
本文探讨了如何通过得分规则衡量概率预测方案的性能,包括在二元情况下的 Brier 得分和有限值目标的预测,分析了分辨率和可靠性对得分的积极影响以及与预测质量相关的概念。
Jun, 2008
本文通过对多元概率时间序列预测的妥善评估进行了系统的有限采样研究,并通过对合成基准的权力分析,确定了评分规则的 “可靠区域”,以确定其在识别预测误差方面的可靠性,并结合电力生产问题对其在实际任务中的通用性进行了评估。
Apr, 2023