球面离散数据拟合的积分算子方法
提供了一种高效的样本多项式时间估计器,用于高维球形高斯混合模型中,从而显着降低了时间和样本复杂度,并且还提出了针对一维混合模型的简单估计器及一种更快的算法,用于从一组分布中选择密度估计。
Feb, 2014
通过一个特定的分解,我们将用于计算积分的基于核的求积法则视为正定核的随机特征扩展的一种特例。我们提供了理论分析,给出了给定逼近误差所需样本数的上下界,特别地,我们展示了上界可以从一种特定的非一致分布中独立同分布地获得,而下界对于任何一组点都是有效的。
Feb, 2015
该研究论文介绍了一种分布式插值方法,用于管理和量化由插值具有非可忽略的大小的嘈杂球形数据引发的不确定性,并展示了对具有挑战性计算环境中的嘈杂数据进行处理时,该方法在实际应用中的实用性和鲁棒性。
Oct, 2023
在本研究中,我们考虑了数值积分的问题,即仅使用对被积函数进行逐点评估的方法,用目标概率测度来近似积分。我们提出了一种有效的程序,利用所给的包含有n个独立同分布的观测样本和总体分布密切相关的再现核希尔伯特空间中的积分函数。我们的主要结果是,对于两种不同的抽样策略,我们的程序的近似误差有一个上界。这个上界给出了对子样本大小的充分条件,以恢复标准的(最佳的)n^{-1/2}速率,同时大大减少了函数评估的数量,从而减少整体的计算成本。此外,我们获得了关于积分函数评估数量m的速率,这些速率能够适应其平滑性,并且在Sobolev空间等情况下与已知的最佳速率相匹配。我们通过对真实数据集的数值实验来说明我们的理论发现,这些实验突出了我们的方法在效率-精度权衡方面与现有的随机和贪婪积分方法相比的优势。值得注意的是,RKHS中的数值积分问题归结为设计目标分布的离散近似核平均嵌入。因此,我们的结果还包括了计算分布间最大均值差异和设计有效的基于核的检验的高效方法。
Nov, 2023
通过使用随机点值函数的加权最小二乘逼近方法,该研究论文提供了一种依赖于投影行列式点过程(DPP)或体积采样的加权最小二乘泛化版本,证明了在期望意义下使用O(mlog(m))个样本时预期的L^2误差受到常数倍的L^2最佳逼近误差的限制,并证明了在函数属于连续嵌入L^2的某个范数向量空间H的情况下,逼近几乎一定受到H范数下最佳逼近误差的限制,最后通过数值实验展示了不同策略的性能。
Dec, 2023
该研究论文探讨了在重现核希尔伯特空间(RKHS)中应用的谱算法,特别关注输入特征空间的内在结构,将输入数据视为嵌入高维欧几里得空间的低维流形,使用积分算子技术导出了关于广义范数的紧密收敛上界,证明估计器在强意义下收敛于目标函数及其导数,进一步建立了渐近优化性的最小化下界,验证了谱算法在高维逼近问题中的实际重要性。
Mar, 2024
本研究解决了大规模散点数据插值的方法空白,提出了一种基于Mat\'ern类的多尺度近似新方法。通过在样本坐标中表示广义Vandermonde矩阵,显著提高了计算效率,使得对于N个数据点的处理成本仅为$\mathcal{O}(N \log N)$,且在数值求解中保持良好的条件数。
Sep, 2024
本研究针对高维空间中适合球面数据拟合的困难,提出了一种新的算法——截断核随机梯度下降(T-kernel SGD)。该算法通过动态调整假设空间,平衡偏差和方差,并且能够在使用常数步长时针对球面以理论最优的速度收敛,同时显著降低计算复杂度和存储需求。
Oct, 2024