Mar, 2024

高维度中的多个均值向量估计

TL;DR基于独立样本,我们尝试估计各种概率分布的共同空间上的多维均值。我们的方法通过凸组合样本的经验均值来形成估计器。我们介绍了两种找到合适的数据依赖凸组合权重的策略:第一种策略利用测试过程识别方差较低的相邻均值,从而得到一个权重的闭式插值公式;第二种策略通过最小化二次风险上界确定权重。通过理论分析,我们评估了我们的方法在二次风险上相对于经验均值的改进。我们的分析集中在维度渐进的角度上,显示我们的方法在数据的有效维度增加时渐进地接近一个理想(极小化)改进。通过在模拟和真实数据集上进行实验,我们展示了我们的方法在估计多核均值嵌入方面的有效性。