估计最大期望值:(嵌套)交叉验证和最大样本平均值的分析
本文分析了预期验证性能的三个统计估计方法在计算预算方面的效果,并在合成和现实情况下对三个估计器进行评估。其中,无偏估计器具有最高方差,方差最小的估计器具有最大的偏差;最小均方误差的估计器在偏差和方差之间取得了平衡,呈现出经典的偏差 - 方差权衡。我们使用预期验证性能来比较不同模型,并分析每个估计器导致选择哪个模型表现最佳的错误数量。我们发现两个有偏估计器导致最少的错误结论,这提示了最小化方差和均方误差的重要性。
Oct, 2021
研究了交叉验证的中心极限定理和渐近方差一致估计,为 $k$ 折测试错误的可实现渐近精确置信区间和有效的假设测试提供了理论框架,并且在真实数据实验中表现优异。
Jul, 2020
提供数量证据来推动研究者使用嵌套交叉验证方法,同时介绍在研究设计中进行机器学习分析的功率分析方法和 MATLAB 代码,使用 Monte Carlo 模拟比较了四种不同的交叉验证方法,在统计效力和统计置信度方面比较,结果表明嵌套 10 折交叉验证具有最高的统计置信度和统计效力,而样本量要求比单次留存法少 50%,嵌套交叉验证模型的置信度比单次留存法模型高四倍。
Aug, 2023
该论文对比了几种在实际模型选择问题中广泛使用的贝叶斯模型选择方法,重点关注回归和分类的变量子集选择,并使用模拟和现实世界的数据进行了几次数值实验。结果表明,考虑到模型不确定性是预测效果最好的。此外,投影法明显优于交叉验证得分的基于选择的方法,并且交叉验证在指导模型大小选择和评估最终选择的模型的预测性能方面大有裨益。
Mar, 2015
研究估计协方差超参数的最大似然(ML)和交叉验证(CV)方法, 结果发现 CV 方法在协方差函数被错误指定时表现更好,但当模型被很好指定时,ML 更优。进一步将单参数情况扩展到了估计具有协方差函数的超参数的情况。
Jan, 2013
通过单个牛顿推的启动程序,实现了对大量训练数据集的 CV 的近似,解决了 CV 运行时间长的问题;本文提供了一致的非渐进性,确定性的模型评估保证,同时也保证了与 CV 相当的模型选择性能。
Mar, 2020
该论文提出了一种新的框架,将一类分布估计算法,特别是协方差矩阵适应算法,写成了蒙特卡罗期望最大化算法和无限样本极限下的精确 EM,这个发现为 EDAs 研究提供了一个基于 EM 坚实统计基础的新的、一致的框架。
May, 2019
本文通过理论分析,证明了 Bayes 交叉验证损失与广泛适用信息准则的随机变量是等价的,并阐明了交叉验证误差和泛化误差之间的关系取决于学习机的代数几何结构。
Apr, 2010
本文主要研究了 Bayesian model 的 Bayesian cross-validation 技术在高斯潜在变量模型中的应用,通过 Laplace method 或 expectation propagation 方法来估计与推断,旨在评估快速方法的准确性和可靠性。实证结果表明,基于 LOO 边缘分布(cavity distribution)的高斯近似法可获得最准确可靠结果。
Dec, 2014