特征与通用张量积核函数
本研究提供了一个统一的框架,将统计学文献中的能量距离和距离协方差与机器学习中的最大均值差(MMD)联系起来,并研究了这些统计量在一些概率分布下的可靠性和对多参数数据的适用性。
Jul, 2012
本文使用希尔伯特 - 施密特独立准则(HSIC)作为检验统计量,构建了独立性的统计检验方法,通过分析联合分布的嵌入和边缘分布乘积的嵌入之间在再生核希尔伯特空间中的距离来定义 HSIC。通过本文的研究结果表明,即使在联合分布的核函数不具有特性的情况下,在各自的域上的边缘核函数具有特性的基础上,也可以构建基于 HSIC 的独立性统计检验,并保持其一致性。
Jan, 2015
本文介绍了一种基于最小距离估计的统计模型,即对于可能性不易计算的生成模型,通过指定核函数,作为一个度量距离的最大均值差异(MMD)可以用来进行最小距离估计,同时结合自然梯度下降算法的应用使这种估计更加高效和鲁棒。
Jun, 2019
在本研究中,我们证明了具有连续有界平移不变特征核的 Borel 测度中,Hilbert-Schmidt 独立性准则(HSIC)在 R^d 上的最优最小化估计率为 O (n^(-1/2)),从而证实了许多经常使用的估计器(包括 U 统计量、V 统计量和 Nystrom-based 统计量)在 R^d 上的最小化最优性。
Mar, 2024
本文比较了一些经典的核方法和能量统计测试在不同类型的两组随机变量下的性能,发现在测试显著性差异和分布不同上,这些测试和基于第一时刻测试的特殊高维 t-test 有同样的功效。
Aug, 2015
基于函数空间定义内核的最大均值差异(MMD)的非参数二样本检验程序,用于测试两个函数样本是否具有相同的潜在分布,建立在数据集维数增加情况下 MMD-based 测试效率的基础上。
Aug, 2020
我们提出了一种用于检验 $d$ 个可能连续或不连续的随机变量是否相互独立的方法,该方法利用了二元 Hilbert-Schmidt 独立性准则(HSIC)的思想并允许任意数量的变量,将 $d$ 维联合分布和边缘乘积嵌入到再生核 Hilbert 空间中并定义 $d$ 变量的 Hilbert-Schmidt 独立性准则(dHSIC)为嵌入之间的平方距离。在总体情况下,只要核是特征的,dHSIC 的值为零则说明 $d$ 个变量相互独立。基于对 dHSIC 的经验估计,我们定义了三种不同的非参数假设检验:置换检验、自举检验和基于 Gamma 近似的检验。我们证明了置换检验达到了显著水平,并且自举检验也达到了点态渐近显著水平以及点态渐近一致性(即它能够在大样本极限中检测任何类型的固定依赖性)。Gamma 近似没有这些保证,但它在计算方面非常快,并且对于较小的 $d$,它的性能良好。最后,我们将该检验应用于因果发现问题。
Mar, 2016
通过最大均匀差异(MMD)测试及相关的理论及实验证明了 Radon-Kolmogorov-Smirnov(RKS)测试是一种能够以多个维度和较高平滑性阶数为基础的、具有全功率的测试方法,与神经网络密切相关。
Sep, 2023
本文构建了最大均值差异(MMD)的 Wasserstein 梯度流并研究了其收敛性质,提出了一个基于梯度注入噪声的方法进行正则化,并给出了其理论和实证证据。该流的实现很简单,因为 MMD 及其梯度均具有简单的封闭形式表达式,可通过样本轻松估计。
Jun, 2019