Nov, 2023

利用装袋后验进行可重复的参数推断

TL;DR在模型错配方面,贝叶斯后验经常无法正确量化真实参数或伪真参数的不确定性,并导致模型在独立数据集上产生矛盾的后验分布。为了定义在模型错配中可复现的不确定性量化准则,我们考虑从独立数据集构建的两个置信区间的重叠概率,并建立了适用于任何有效置信区间的重叠概率下界。我们证明了标准后验的可信区间往往会严重违反这个下界,尤其在高维环境中(即维度随样本大小增加)表现出不内聚性。为了提高易使用性和普适性,并改善可复现性,我们提出将bagging方法应用于贝叶斯后验(“BayesBag”'),即使用基于自助样本构建的后验分布的平均值。我们基于第一原则从Jeffrey条件化的角度推导了BayesBag,并证明了袋装后验通常满足重叠下界。此外,我们证明了袋装后验的Bernstein-Von Mises定理,确定了其渐进正态分布。我们通过模拟实验和犯罪率预测应用展示了BayesBag的优势。