使用 James-Stein 估计器改善归一化

Dec, 2023

Improving Normalization with the James-Stein Estimator

Seyedalireza Khoshsirat, Chandra Kambhamettu

TL;DR在本文中，我们首先确定深度学习中的归一化层使用的均值和方差估计器不可接受，然后介绍了一种运用 James-Stein 估计器改进均值和方差估计的新方法，评估表明我们改进的归一化层在各种计算机视觉任务中始终具有优越的准确性，而且不增加额外的计算负担。此外，我们还研究了两种显著的缩小估计器：Ridge 和 LASSO，通过可视化表示直观地展示了缩小对估计层统计量的影响，并对正则化和批量大小对我们修改后的批量归一化的影响进行了研究，研究显示我们的方法对批量大小和正则化不太敏感，在不同设置下提高了准确性。

Abstract

stein's paradox holds considerable sway in high-dimensional statistics, highlighting that the sample mean, traditionally considered the de facto estimator, might not be the most efficacious in higher dimensions. To address this, the →

stein's paradox james-stein estimator normalization layers shrinkage estimators batch normalization

发现论文，激发创造

利用 James-Stein 估计器控制黑盒变分推断的方差

黑盒变分推断是在使变分推断更 “黑盒” 的最近努力中的一个有前途的框架，但在基本版本中，它要么由于不稳定性而无法收敛，要么在执行前需要调整更新步骤，这使得它不完全通用。我们提出了一种通过将随机梯度上升重新定位为多元估计问题来规范其参数更新的方法。所提出的方法在方差减小方面相对较弱，但提供了更简单的代替和不需要分析师进行微调的权衡。基准数据集上的性能还表明，在模型拟合和收敛时间方面，与 Rao-Blackwell 化方法相比具有一致的表现或更好。

May, 2024

核均值估计与斯坦效应

该研究通过分析定量估计中的 Stein 现象，提出一个更优的核均值估计器，进而展示了一类比标准估计器更好的估计器，并着重讨论了其中的子类，提出了一种高效的收缩估计器。

Jun, 2013

基于 Stein 方法的一类估计器的收敛速率

使用斯坦因方法可以通过采样分布的渐变信息来减少蒙特卡罗估计器的方差，本文建立了一类基于斯坦因方法的估计器的理论界限，分析考虑了采样分布和测试函数的平滑程度，状态空间的维数，以及来源于马尔可夫链的非独立样本的情况，这些结果提供了关于基于梯度的估计器快速收敛的见解，以及澄清了这种方法固有的维度问题。

Mar, 2016

斯坦神经采样器

使用神经网络构建的两种采样器，通过训练最小化 Stein discrepancy 的方法，针对非标准化密度函数生成高质量的样本，相对传统采样方法具有更优的收敛性能。

Oct, 2018

熵推断和 James-Stein 估计器及其在非线性基因关联网络中的应用

本文提出了一种有效估计熵和互信息的程序，并将其应用于推断高维基因关联网络的问题上。通过开发一种 James-Stein 类型的收缩估计器，我们得到了一种高效的统计和计算过程，该过程虽然简单，但在各种采样情况和数据生成模型下均优于其他八种熵估计程序，甚至在样本不足的情况下也是如此。我们通过分析大肠杆菌基因表达数据并从基因表达数据计算熵基因关联网络来说明这种方法。提供了一个实现所提出的收缩估计器的计算机程序。

Nov, 2008

利用有限样本在神经表示上估计形状距离

通过推导上、下界，分析了高维网络表示的几何相似性测量方法的统计效率和估计不确定性，提出了一种新的矩法估计器，在高维特征空间中优于标准估计器，为高维形状分析奠定了统计理论基础。

Oct, 2023

Newton-Stein 方法：通过 Stein 引理优化广义线性模型的方法

该论文提出了一种利用估计问题和 Stein 引理来构造曲率信息的算法，同时探讨了这种算法在广义线性模型中的应用和收敛性分析。实验证明，该算法在多个数据集上的表现都优于其他算法。

Nov, 2015

斯坦点

该研究论文探讨了一种基于 Stein Points 的方法，重点在于实现在点的选择方面很小的情况下实现准确的近似。使用贪婪或条件梯度法减小内核 Stein 差异，该方法能够以适度的计算成本准确近似后验。同时，理论结果表明了方法的收敛性。

Mar, 2018

Rao-Blackwell 算法优化直通 Gumbel-Softmax 梯度估计器

本研究提出了一种对 Gumbel-Softmax estimator 进行 Rao-Blackwellization 的方法，可在不增加函数评估数量的情况下减少方差，从而降低均方误差，并在两种无监督潜变量模型中得到了实证验证。

Oct, 2020

分布鲁棒逆协方差估计：Wasserstein 收缩估计器

提出分布鲁棒的最大似然估计模型，结合 Wasserstein 模糊集，从 n 个独立样本中推断出 $p$ 维高斯随机向量的逆协方差矩阵；当估计问题没有结构信息时，该估计问题有自然地解释为非线性缩小估计器。同时，本研究还为高斯图模型开发了一个顺序二次近似算法。

May, 2018