May, 2021
无需样本拆分的直方图分箱分布自由校准保证
Distribution-free calibration guarantees for histogram binning without
sample splitting
TL;DR本文提出了针对Zadrozny和Elkan [2001]的常用的直方图分箱(也称为均匀质量分箱)方法的校准保证。作者分析了双倍数据的原始方法的实用性,并使用一定的统计学性质证明了直方图分箱方法的校准保证。作者提出了新的工具-validity plots,用于评估校准并提出了实用建议。