估计最大期望值：（嵌套）交叉验证和最大样本平均值的分析

Feb, 2013

估计最大期望值：（嵌套）交叉验证和最大样本平均值的分析

Estimating the Maximum Expected Value: An Analysis of (Nested) Cross Validation and the Maximum Sample Average

Hado van Hasselt

TL;DR研究通用的随机变量最大期望值的两种常见估计量的准确性：最大样本平均值的一般化和交叉验证。通过研究和限定上述估计量的偏差和方差，并证明了其一致性。交叉验证的方差可以显著减小，但风险是引入大偏差；交叉验证不同变体的偏差和方差因问题而异，选择错误可能导致估计结果不准确。

Abstract

We investigate the accuracy of the two most common estimators for the maximum expected value of a general set of random variables: a generalization of the maximum sample average, and →

estimators random variables maximum expected value cross validation bias

发现论文，激发创造

随机变量的最大值的预期验证性能和估计

本文分析了预期验证性能的三个统计估计方法在计算预算方面的效果，并在合成和现实情况下对三个估计器进行评估。其中，无偏估计器具有最高方差，方差最小的估计器具有最大的偏差；最小均方误差的估计器在偏差和方差之间取得了平衡，呈现出经典的偏差 - 方差权衡。我们使用预期验证性能来比较不同模型，并分析每个估计器导致选择哪个模型表现最佳的错误数量。我们发现两个有偏估计器导致最少的错误结论，这提示了最小化方差和均方误差的重要性。

Oct, 2021

测试误差的交叉验证置信区间

研究了交叉验证的中心极限定理和渐近方差一致估计，为 $k$ 折测试错误的可实现渐近精确置信区间和有效的假设测试提供了理论框架，并且在真实数据实验中表现优异。

Jul, 2020

在语音、语言和听力科学中迈向具有普适性的机器学习模型：功效分析和样本量估计

提供数量证据来推动研究者使用嵌套交叉验证方法，同时介绍在研究设计中进行机器学习分析的功率分析方法和 MATLAB 代码，使用 Monte Carlo 模拟比较了四种不同的交叉验证方法，在统计效力和统计置信度方面比较，结果表明嵌套 10 折交叉验证具有最高的统计置信度和统计效力，而样本量要求比单次留存法少 50%，嵌套交叉验证模型的置信度比单次留存法模型高四倍。

Aug, 2023

比较贝叶斯预测方法用于模型选择

该论文对比了几种在实际模型选择问题中广泛使用的贝叶斯模型选择方法，重点关注回归和分类的变量子集选择，并使用模拟和现实世界的数据进行了几次数值实验。结果表明，考虑到模型不确定性是预测效果最好的。此外，投影法明显优于交叉验证得分的基于选择的方法，并且交叉验证在指导模型大小选择和评估最终选择的模型的预测性能方面大有裨益。

Mar, 2015

高斯过程在模型误差条件下的超参数交叉验证和最大似然估计

研究估计协方差超参数的最大似然（ML）和交叉验证（CV）方法，结果发现 CV 方法在协方差函数被错误指定时表现更好，但当模型被很好指定时，ML 更优。进一步将单参数情况扩展到了估计具有协方差函数的超参数的情况。

Jan, 2013

近似交叉验证：模型评价和选择的保证

通过单个牛顿推的启动程序，实现了对大量训练数据集的 CV 的近似，解决了 CV 运行时间长的问题；本文提供了一致的非渐进性，确定性的模型评估保证，同时也保证了与 CV 相当的模型选择性能。

Mar, 2020

基于期望最大化的分布估计算法视角

该论文提出了一种新的框架，将一类分布估计算法，特别是协方差矩阵适应算法，写成了蒙特卡罗期望最大化算法和无限样本极限下的精确 EM，这个发现为 EDAs 研究提供了一个基于 EM 坚实统计基础的新的、一致的框架。

May, 2019

奇异学习理论中的贝叶斯交叉验证与广泛适用信息准则的渐近等价性

本文通过理论分析，证明了 Bayes 交叉验证损失与广泛适用信息准则的随机变量是等价的，并阐明了交叉验证误差和泛化误差之间的关系取决于学习机的代数几何结构。

Apr, 2010

基于贝叶斯的留一法交叉验证近似方法应用于高斯潜变量模型

本文主要研究了 Bayesian model 的 Bayesian cross-validation 技术在高斯潜在变量模型中的应用，通过 Laplace method 或 expectation propagation 方法来估计与推断，旨在评估快速方法的准确性和可靠性。实证结果表明，基于 LOO 边缘分布（cavity distribution）的高斯近似法可获得最准确可靠结果。

Dec, 2014

使用赌博方法估计有限随机变量的均值

本文引导出了计算未知均值的置信区间和时间均匀置信序列的一般方法，并应用于研究有界均值、有限抽样和无限抽样等多个问题。

Oct, 2020