Nov, 2023

在再生核希尔伯特空间中通过杠杆得分采样实现高效数值积分

TL;DR在本研究中,我们考虑了数值积分的问题,即仅使用对被积函数进行逐点评估的方法,用目标概率测度来近似积分。我们提出了一种有效的程序,利用所给的包含有 n 个独立同分布的观测样本和总体分布密切相关的再现核希尔伯特空间中的积分函数。我们的主要结果是,对于两种不同的抽样策略,我们的程序的近似误差有一个上界。这个上界给出了对子样本大小的充分条件,以恢复标准的(最佳的)n^{-1/2} 速率,同时大大减少了函数评估的数量,从而减少整体的计算成本。此外,我们获得了关于积分函数评估数量 m 的速率,这些速率能够适应其平滑性,并且在 Sobolev 空间等情况下与已知的最佳速率相匹配。我们通过对真实数据集的数值实验来说明我们的理论发现,这些实验突出了我们的方法在效率 - 精度权衡方面与现有的随机和贪婪积分方法相比的优势。值得注意的是,RKHS 中的数值积分问题归结为设计目标分布的离散近似核平均嵌入。因此,我们的结果还包括了计算分布间最大均值差异和设计有效的基于核的检验的高效方法。