高维度中的多个均值向量估计

Mar, 2024

Estimation of multiple mean vectors in high dimension

Gilles Blanchard, Jean-Baptiste Fermanian, Hannah Marienwald

TL;DR基于独立样本，我们尝试估计各种概率分布的共同空间上的多维均值。我们的方法通过凸组合样本的经验均值来形成估计器。我们介绍了两种找到合适的数据依赖凸组合权重的策略：第一种策略利用测试过程识别方差较低的相邻均值，从而得到一个权重的闭式插值公式；第二种策略通过最小化二次风险上界确定权重。通过理论分析，我们评估了我们的方法在二次风险上相对于经验均值的改进。我们的分析集中在维度渐进的角度上，显示我们的方法在数据的有效维度增加时渐进地接近一个理想（极小化）改进。通过在模拟和真实数据集上进行实验，我们展示了我们的方法在估计多核均值嵌入方面的有效性。

Abstract

We endeavour to estimate numerous multi-dimensional means of various probability distributions on a common space based on independent samples. Our approach involves forming estimators through →

multi-dimensional means probability distributions convex combinations quadratic risk kernel mean embeddings

发现论文，激发创造

密度估计器的线性和凸聚合

本文研究了密度估计器线性和凸聚合的问题，并提供相应的程序及其风险的奥卡尔不等式，以及相似核函数的线性和凸聚合方案可在 Sobolev 密度族中进行一致最优的最小化。

May, 2006

高斯均值全方位健壮估计器

本文研究了一个基于迭代重新加权的估计方法，该方法针对多元高斯分布的均值具有鲁棒性，且具有多个优秀性质，包括计算上的可行性、对平移、伸缩和正交变换的不变性、高断点以及渐近有效性。此外，本文还为提出的估计器建立了无维度的非渐近风险界限，并将结果推广到了子高斯分布和污染率未知、协方差矩阵未知等情形。

Feb, 2020

鲁棒经验均值估计器

本文研究了概率测度 $P$ 均值的健壮估计量，提出了一种稍微复杂的构造方法以处理健壮 $M$- 估计问题，并将该方法应用于最小二乘密度估计、具有 Kullback 损失的密度估计以及非高斯、不受限制的随机设计和异方差回归问题，同时作者表明该策略也可以用于数据只被假设为混合的情况。

Dec, 2011

鲁棒多元均值估计：修剪均值的最优性

本文研究在随机向量有敌对污染的情况下，通过观测值估计其均值的问题，并介绍了一个多元的修剪均值估计器并证明了在极小条件下其具有最优性能。

Jul, 2019

高维度差分隐私估计器设计

本研究在高维度背景下研究差分隐私的均值估计问题，通过将高维度鲁棒统计的结果应用到差分隐私中，提出了一种计算可行的算法，能够在高维度下完成差分隐私的均值估计，并且在人工合成数据集上表现出了优异的性能。

Jun, 2020

估计纠缠单样本分布中的位置参数

本研究考虑了独立采样数据的公共平均值估计问题，提出了一种估计器，它能够适应数据异质性的水平，在 i.i.d. 和某些非同质的设置下均达到近似最优，其估计器既考虑了传统统计学中的模态区间、shorth、中位数估计器，又利用了新型经验过程理论结果，在多元估计和回归的情况下，我们提出了可在多项式时间内运行的估计器版本。

Jul, 2019

关于高维重抽样的一些非渐进结果，I：置信域，II：多重检验

本文研究了应用于具有未知依赖关系结构的随机向量均值的广义自助法置信区间，并针对高维向量进行非渐近控制，分别采用了基于浓度原理和基于重新采样分位数量化的方法，并且考虑了蒙特卡罗法的精度问题。

Dec, 2007

高维超统计特征分类

研究在高维情况下通过经验风险最小化学习具有通用质心的两个数据点云的特征，涵盖了大量的数据分布，包括高斯混合分布和幂律分布，并分析了通过正则化的作用，推导了估计器的泛化性能，并探究了分布尺度参数对可分离性转换的影响。

Apr, 2023

贝叶斯学习核嵌入

该研究提出了一种新的概率模型 —— 贝叶斯核嵌入模型，它可以用于解决核学习中的核选择问题，并给出了一个简单、方便的边缘似然函数用于确定核超参数。

Mar, 2016

高维度估计与几何约束

本文提出了一种简化的半参数单指数模型，用于信号处理中的估计问题，理论基于可行集的平均宽度并通过线性估计和度量投影实现，即使在高噪声情形下，未知的非线性关系也不会显著降低确定信号的能力。

Apr, 2014