球面离散数据拟合的积分算子方法

Jan, 2024

球面离散数据拟合的积分算子方法

Integral Operator Approaches for Scattered Data Fitting on Spheres

Shao-Bo Lin

TL;DR该研究聚焦于球体上的散乱数据拟合问题，研究了一类加权谱过滤算法在拟合含有可能无界随机噪声的噪声数据时的近似性能。通过开发一种积分算子方法来分析，我们能够推导出加权谱过滤算法的最优 Sobolev 类型误差估计，同时我们还提出了一种分而治之的方案来降低算法的计算负担，并给出了最优逼近误差界。

Abstract

This paper focuses on scattered data fitting problems on spheres. We study the approximation performance of a class of weighted spectral filter a

发现论文，激发创造

球形高斯混合物的近最优样本估计器

提供了一种高效的样本多项式时间估计器，用于高维球形高斯混合模型中，从而显着降低了时间和样本复杂度，并且还提出了针对一维混合模型的简单估计器及一种更快的算法，用于从一组分布中选择密度估计。

Feb, 2014

核向量积分规则与随机特征展开的等价性

通过一个特定的分解，我们将用于计算积分的基于核的求积法则视为正定核的随机特征扩展的一种特例。我们提供了理论分析，给出了给定逼近误差所需样本数的上下界，特别地，我们展示了上界可以从一种特定的非一致分布中独立同分布地获得，而下界对于任何一组点都是有效的。

Feb, 2015

通过近似Wasserstein流形解决一般椭圆混合模型

本文提出了一种基于Wasserstein距离的椭圆混合模型稳定求解方法，能够显著地改善EMM估计并加速收敛。

Jun, 2019

在球面上的核插值分布式不确定性量化

该研究论文介绍了一种分布式插值方法，用于管理和量化由插值具有非可忽略的大小的嘈杂球形数据引发的不确定性，并展示了对具有挑战性计算环境中的嘈杂数据进行处理时，该方法在实际应用中的实用性和鲁棒性。

Oct, 2023

在再生核希尔伯特空间中通过杠杆得分采样实现高效数值积分

在本研究中，我们考虑了数值积分的问题，即仅使用对被积函数进行逐点评估的方法，用目标概率测度来近似积分。我们提出了一种有效的程序，利用所给的包含有n个独立同分布的观测样本和总体分布密切相关的再现核希尔伯特空间中的积分函数。我们的主要结果是，对于两种不同的抽样策略，我们的程序的近似误差有一个上界。这个上界给出了对子样本大小的充分条件，以恢复标准的（最佳的）n^{-1/2}速率，同时大大减少了函数评估的数量，从而减少整体的计算成本。此外，我们获得了关于积分函数评估数量m的速率，这些速率能够适应其平滑性，并且在Sobolev空间等情况下与已知的最佳速率相匹配。我们通过对真实数据集的数值实验来说明我们的理论发现，这些实验突出了我们的方法在效率-精度权衡方面与现有的随机和贪婪积分方法相比的优势。值得注意的是，RKHS中的数值积分问题归结为设计目标分布的离散近似核平均嵌入。因此，我们的结果还包括了计算分布间最大均值差异和设计有效的基于核的检验的高效方法。

Nov, 2023

基于行列式点过程和广义容积抽样的加权最小二乘逼近

通过使用随机点值函数的加权最小二乘逼近方法，该研究论文提供了一种依赖于投影行列式点过程（DPP）或体积采样的加权最小二乘泛化版本，证明了在期望意义下使用O(mlog(m))个样本时预期的L^2误差受到常数倍的L^2最佳逼近误差的限制，并证明了在函数属于连续嵌入L^2的某个范数向量空间H的情况下，逼近几乎一定受到H范数下最佳逼近误差的限制，最后通过数值实验展示了不同策略的性能。

Dec, 2023

球面核插值的加权谱滤波器：噪声数据的预测准确性估计

通过引入加权谱滤波方法来减小核矩阵的条件数并稳定核插值，尤其适用于处理嘈杂数据，在地球物理图像重建和气候图像处理方面具有应用潜力。

Jan, 2024

通过扩散实现流形上的谱算法

该研究论文探讨了在重现核希尔伯特空间(RKHS)中应用的谱算法，特别关注输入特征空间的内在结构，将输入数据视为嵌入高维欧几里得空间的低维流形，使用积分算子技术导出了关于广义范数的紧密收敛上界，证明估计器在强意义下收敛于目标函数及其导数，进一步建立了渐近优化性的最小化下界，验证了谱算法在高维逼近问题中的实际重要性。

Mar, 2024

样本坐标下的多尺度散点数据分析

本研究解决了大规模散点数据插值的方法空白，提出了一种基于Mat\'ern类的多尺度近似新方法。通过在样本坐标中表示广义Vandermonde矩阵，显著提高了计算效率，使得对于N个数据点的处理成本仅为$\mathcal{O}(N \log N)$，且在数值求解中保持良好的条件数。

Sep, 2024

球面上的截断核随机梯度下降

本研究针对高维空间中适合球面数据拟合的困难，提出了一种新的算法——截断核随机梯度下降（T-kernel SGD）。该算法通过动态调整假设空间，平衡偏差和方差，并且能够在使用常数步长时针对球面以理论最优的速度收敛，同时显著降低计算复杂度和存储需求。

Oct, 2024