本文研究了如何在关系系统中估计数据之间的独立性,提出了一种基于核均值嵌入的方法,用于定义条件和边缘独立性测试,并在结构假设下实现了可伸缩的核测试方法。实证研究表明,该方法在合成网络和半合成网络等数据集上比基于核的独立性测试的现有方法更为有效。
Jun, 2022
描述了一种数据高效、基于核的条件独立性统计检验方法,通过数据拆分、辅助数据和更简单的函数类别等方法,控制偏差并校正测试水平,适用于合成和真实数据。
Feb, 2024
探讨了决策理论问题中的非参数双样本检验与独立性检验,并指出使用核函数和点对之间的距离作为解决方案在高维设置中受到误解,测试的功率实际上随着维度的增加按多项式下降,提出了公平的替代假设,并阐明了核带宽选择中的中位数启发式的理论洞察力。
Jun, 2014
提出了一种新的计算有效的依赖度量和自适应统计独立性检验方法,其特点是数据高效运行时间为线性,并且在真实基准中表现良好。
Oct, 2016
本研究探讨了顺序非参数两样本和独立性检验的问题,提出了一种基于预测的赌博策略,用于解决高维结构化数据上核函数的选择问题。我们在实验中证明了这种方法优于基于核的方法,即使在数据分布随时间漂移的情况下,也仍然有效强大。
Apr, 2023
提出一种基于重现核希尔伯特空间和大偏差界限的统计检验框架,可用于分析和比较分布,特别对于数据库属性匹配具有很好的性能表现。
May, 2008
文中提出了一种新的非参数化方法用于测试两个随机过程之间的独立性,使用了 Hilbert Schmidt 独立性准则(HSIC)作为检验统计量,该方法针对从随机过程中绘制的样本计算 HSIC 的渐近行为得到了建立,并且推荐了一种可替代的 p 值的一致估计,与线性方法相比,该新测试程序可以发现被线性方法忽略的依赖关系,而先前的自举程序会返回大量错误的结果。
Feb, 2014
本文首次提供了 Nyström 方法用于求解不定核的低秩矩阵逼近的数学完整证明,并提出了一种高效的方法来寻找这种核矩阵的近似特征分解,以此构建可在再现核 Krein 空间中学习的高度可扩展方法。这些方法提供了一种有原则的并且理论基础良好的方法来解决大规模关于不定核的学习问题。本文的主要动机来自于具有结构表示的问题(例如图形,字符串,时间序列),在这些问题上,根据直觉和 / 或领域专家的知识很容易设计出一对一的(不)相似度函数。这些函数通常不是正定形的,并且超出了实践者的专业知识范围。本文使用不定核构建在结构化和向量化数据表示中,通过经验证明了这些方法的有效性。
Sep, 2018
该论文提出了一种基于核函数的机器学习算法,可以通过对数据集的分组进行处理,采用独立同分布的样本集作为数据点,利用非参数估计器提取核函数特征从而实现多种分类、回归和异常检测等任务。
Feb, 2012
本文提出了一种新的双射变换方法,将 Distance-based tests 和 Kernel-based tests 两者结合起来,并简化了固定点变换方法,提高了数据结构保留能力。该方法有望促进 Distance-based and Kernel-based 方法学术界之间的相互了解和直接交流。
Jun, 2018