Aug, 2024
评估后验概率:决策理论、适当评分规则与校准
Evaluating Posterior Probabilities: Decision Theory, Proper Scoring
Rules, and Calibration
TL;DR本文针对当前机器学习分类器后验概率评估的不足,提出采用期望适当评分规则(PSRs)作为后验质量的主要评估指标,而非常用的校准度量(如期望校准误差,ECE)。研究发现,校准度量只能反映后验质量的一个方面,忽视了区分性能,而期望PSRs能够提供更全面的质量评估,具有重要的理论和实践意义。