具有分析核嵌入的独立性自适应测试
本文使用希尔伯特 - 施密特独立准则(HSIC)作为检验统计量,构建了独立性的统计检验方法,通过分析联合分布的嵌入和边缘分布乘积的嵌入之间在再生核希尔伯特空间中的距离来定义 HSIC。通过本文的研究结果表明,即使在联合分布的核函数不具有特性的情况下,在各自的域上的边缘核函数具有特性的基础上,也可以构建基于 HSIC 的独立性统计检验,并保持其一致性。
Jan, 2015
本文研究了如何在关系系统中估计数据之间的独立性,提出了一种基于核均值嵌入的方法,用于定义条件和边缘独立性测试,并在结构假设下实现了可伸缩的核测试方法。实证研究表明,该方法在合成网络和半合成网络等数据集上比基于核的独立性测试的现有方法更为有效。
Jun, 2022
本文提出了一种基于 copula 的新型随机变量依赖度测量方法,延伸了 MMH 方法至联合分布的 copula,该方法类似于 Shannon 互信息,能够不受边缘变量任何严格增加变换的影响,重要的是在很多应用中,例如特征选择。本文通过一系列实验说明了理论贡献的作用在于特征选择和低维分布嵌入中。同时,该方法的估计是始终如一的,对离群值具有鲁棒性,并仅使用排名统计数据。该方法提出了收敛速率和独立性检验的上界。
Jun, 2012
本文通过对大规模核逼近方法的研究,对比块状、Nystrom 和随机 Fourier 特征方法的性能,展示了这些新型的大规模方法在独立性检验中具有与现有方法相当的性能,但使用的计算时间和内存显著减少。
Jun, 2016
我们提出了一种用于检验 $d$ 个可能连续或不连续的随机变量是否相互独立的方法,该方法利用了二元 Hilbert-Schmidt 独立性准则(HSIC)的思想并允许任意数量的变量,将 $d$ 维联合分布和边缘乘积嵌入到再生核 Hilbert 空间中并定义 $d$ 变量的 Hilbert-Schmidt 独立性准则(dHSIC)为嵌入之间的平方距离。在总体情况下,只要核是特征的,dHSIC 的值为零则说明 $d$ 个变量相互独立。基于对 dHSIC 的经验估计,我们定义了三种不同的非参数假设检验:置换检验、自举检验和基于 Gamma 近似的检验。我们证明了置换检验达到了显著水平,并且自举检验也达到了点态渐近显著水平以及点态渐近一致性(即它能够在大样本极限中检测任何类型的固定依赖性)。Gamma 近似没有这些保证,但它在计算方面非常快,并且对于较小的 $d$,它的性能良好。最后,我们将该检验应用于因果发现问题。
Mar, 2016
该研究提出了一类非参数两样本检验,其代价与样本大小成线性关系;文中给出了两种基于代表每个分布的解析函数距离集合的检验方法,其中第一种检验使用平滑的经验特征函数来表示分布,第二种使用再生核 Hilbert 空间中的分布嵌入。该方法具有更好的功率 / 时间平衡,并在高维度情况下保留了性能优势。
Jun, 2015
文中提出了一种新的非参数化方法用于测试两个随机过程之间的独立性,使用了 Hilbert Schmidt 独立性准则(HSIC)作为检验统计量,该方法针对从随机过程中绘制的样本计算 HSIC 的渐近行为得到了建立,并且推荐了一种可替代的 p 值的一致估计,与线性方法相比,该新测试程序可以发现被线性方法忽略的依赖关系,而先前的自举程序会返回大量错误的结果。
Feb, 2014
使用 Hilbert-Schmidt 独立准则(HSIC)测量依赖性,建立了新型非参数统计假设检验方法,用于确定一个源变量对于两个候选目标变量的依赖性。测试表明第一个依赖度量是否显著大于第二个,其结果表明建立这些 HSIC 统计数据之间的协方差计算比独立 HSIC 统计量的子采样法更有效。
Jun, 2014
本研究探讨了顺序非参数两样本和独立性检验的问题,提出了一种基于预测的赌博策略,用于解决高维结构化数据上核函数的选择问题。我们在实验中证明了这种方法优于基于核的方法,即使在数据分布随时间漂移的情况下,也仍然有效强大。
Apr, 2023