具有分析核嵌入的独立性自适应测试

Oct, 2016

具有分析核嵌入的独立性自适应测试

An Adaptive Test of Independence with Analytic Kernel Embeddings

Wittawat Jitkrittum, Zoltan Szabo, Arthur Gretton

TL;DR提出了一种新的计算有效的依赖度量和自适应统计独立性检验方法，其特点是数据高效运行时间为线性，并且在真实基准中表现良好。

Abstract

A new computationally efficient dependence measure, and an adaptive statistical test of independence, are proposed. The →

dependence measure statistical test independence test power data-efficient

发现论文，激发创造

核独立性检验的一种更简易的一致性条件

本文使用希尔伯特 - 施密特独立准则（HSIC）作为检验统计量，构建了独立性的统计检验方法，通过分析联合分布的嵌入和边缘分布乘积的嵌入之间在再生核希尔伯特空间中的距离来定义 HSIC。通过本文的研究结果表明，即使在联合分布的核函数不具有特性的情况下，在各自的域上的边缘核函数具有特性的基础上，也可以构建基于 HSIC 的独立性统计检验，并保持其一致性。

Jan, 2015

关系依赖关系的非参数推断

本文研究了如何在关系系统中估计数据之间的独立性，提出了一种基于核均值嵌入的方法，用于定义条件和边缘独立性测试，并在结构假设下实现了可伸缩的核测试方法。实证研究表明，该方法在合成网络和半合成网络等数据集上比基于核的独立性测试的现有方法更为有效。

Jun, 2022

基于 Copula 的核依赖度量

本文提出了一种基于 copula 的新型随机变量依赖度测量方法，延伸了 MMH 方法至联合分布的 copula，该方法类似于 Shannon 互信息，能够不受边缘变量任何严格增加变换的影响，重要的是在很多应用中，例如特征选择。本文通过一系列实验说明了理论贡献的作用在于特征选择和低维分布嵌入中。同时，该方法的估计是始终如一的，对离群值具有鲁棒性，并仅使用排名统计数据。该方法提出了收敛速率和独立性检验的上界。

Jun, 2012

条件独立性的实用核检验

描述了一种数据高效、基于核的条件独立性统计检验方法，通过数据拆分、辅助数据和更简单的函数类别等方法，控制偏差并校正测试水平，适用于合成和真实数据。

Feb, 2024

大规模核方法独立性检验

本文通过对大规模核逼近方法的研究，对比块状、Nystrom 和随机 Fourier 特征方法的性能，展示了这些新型的大规模方法在独立性检验中具有与现有方法相当的性能，但使用的计算时间和内存显著减少。

Jun, 2016

基于核的联合独立性检验

我们提出了一种用于检验 $d$ 个可能连续或不连续的随机变量是否相互独立的方法，该方法利用了二元 Hilbert-Schmidt 独立性准则（HSIC）的思想并允许任意数量的变量，将 $d$ 维联合分布和边缘乘积嵌入到再生核 Hilbert 空间中并定义 $d$ 变量的 Hilbert-Schmidt 独立性准则（dHSIC）为嵌入之间的平方距离。在总体情况下，只要核是特征的，dHSIC 的值为零则说明 $d$ 个变量相互独立。基于对 dHSIC 的经验估计，我们定义了三种不同的非参数假设检验：置换检验、自举检验和基于 Gamma 近似的检验。我们证明了置换检验达到了显著水平，并且自举检验也达到了点态渐近显著水平以及点态渐近一致性（即它能够在大样本极限中检测任何类型的固定依赖性）。Gamma 近似没有这些保证，但它在计算方面非常快，并且对于较小的 $d$，它的性能良好。最后，我们将该检验应用于因果发现问题。

Mar, 2016

使用概率分布的解析表示进行快速的双样本检验

该研究提出了一类非参数两样本检验，其代价与样本大小成线性关系；文中给出了两种基于代表每个分布的解析函数距离集合的检验方法，其中第一种检验使用平滑的经验特征函数来表示分布，第二种使用再生核 Hilbert 空间中的分布嵌入。该方法具有更好的功率 / 时间平衡，并在高维度情况下保留了性能优势。

Jun, 2015

随机过程的核独立性检验

文中提出了一种新的非参数化方法用于测试两个随机过程之间的独立性，使用了 Hilbert Schmidt 独立性准则（HSIC）作为检验统计量，该方法针对从随机过程中绘制的样本计算 HSIC 的渐近行为得到了建立，并且推荐了一种可替代的 p 值的一致估计，与线性方法相比，该新测试程序可以发现被线性方法忽略的依赖关系，而先前的自举程序会返回大量错误的结果。

Feb, 2014

相对依赖性的低方差一致性测试

使用 Hilbert-Schmidt 独立准则（HSIC）测量依赖性，建立了新型非参数统计假设检验方法，用于确定一个源变量对于两个候选目标变量的依赖性。测试表明第一个依赖度量是否显著大于第二个，其结果表明建立这些 HSIC 统计数据之间的协方差计算比独立 HSIC 统计量的子采样法更有效。

Jun, 2014

序列预测双样本和独立性检验

本研究探讨了顺序非参数两样本和独立性检验的问题，提出了一种基于预测的赌博策略，用于解决高维结构化数据上核函数的选择问题。我们在实验中证明了这种方法优于基于核的方法，即使在数据分布随时间漂移的情况下，也仍然有效强大。

Apr, 2023