基于最近邻采样的条件独立性检验

AAAIApr, 2023

基于最近邻采样的条件独立性检验

Nearest-Neighbor Sampling Based Conditional Independence Testing

Shuai Li, Ziqi Chen, Hongtu Zhu, Christina Dan Wang, Wang Wen

TL;DR本文提出了一种无需假设 X 给定 Z 的精确分布的条件随机化检验的新方法，并利用计算高效的 1 最近邻来近似编码空假设的条件分布。经实验证明，该方法不仅计算速度快，而且对于合成和实际数据分析都非常有效。

Abstract

The conditional randomization test (CRT) was recently proposed to test whether two random variables X and Y are conditionally independent given random variables Z. The CRT assumes that the conditional distribution

conditional randomization test nearest-neighbor sampling conditional distribution conditional-dependence type i and ii errors

发现论文，激发创造

基于最近邻估计器的条件互信息独立性检验

提出了一种基于条件互信息和局部置换方案的全非参数连续数据测试方法，能够适应强非线性相关性，表现优于基于核的测试，并在小样本和高维条件下可靠地模拟零分布。

Sep, 2017

模型驱动的条件独立性检验

针对连续随机变量，我们将条件独立性检验转化为分类问题并实现了非参数化的方案，通过最近邻引导采样策略生成训练样本，并提出一种大型数据集上性能更好的算法，从而实现有效测试。

Sep, 2017

极小极大化最优条件独立性测试

研究了在条件分布连续的情况下，基于条件独立性测试 $X$ 和 $Y$ 关于 $Z$，$X$ 和 $Y$ 均为离散或连续变量的问题。考虑到条件独立性测试的研究，对于所有绝对连续的条件分布都无法设计非平凡的测试以控制所有的一类错误并确保在有趣的替代情况下仍然具有功效，因此在条件分布的各个自然光滑性假设下研究了条件独立性测试的难度，并以总变差度量指标的临界分离半径为下界和上界。最后，提供了一种新的证明方法以证明 Shah 与 Peters 的结论。

Jan, 2020

差分隐私条件独立性检验

本研究探讨在差分隐私的约束下的条件独立性检验，设计了两种基于广义协方差度量的私有 CI 检验以及基于 Candës 等人的条件随机化检验（在模型 - X 假设下），这是第一种适用于 $ Z $ 为连续型变量的私有 CI 检验。

Jun, 2023

基于核的近似条件独立性检验，用于快速的非参数因果关系发现

该研究提出了两种基于随机特征的条件独立性检验方法 RCIT 和 RCoT，它们可以近似替代 KCIT，在大样本情况下比 KCIT 更快更准确，同时应用于 CCD 算法可以提高算法的运行效率。

Feb, 2017

基于互信息的非参数独立性检验

提出了一种称为 MINT 的新方法，该方法基于互信息的估计，并使用从最近的邻居距离导出的有效熵估计器，从而便于将互信息分解为联合和边际熵，用于检验两个多变量随机向量的独立性，并可将其扩展为基于测量协变量向量与误差向量独立性的新正态线性模型是否适配的卡方检验，并在模拟和真实数据上进行了数值研究。

Nov, 2017

混合连续 - 分类变量的非参数条件独立性检验：一种新方法和数值评估

条件独立性检验是机器学习中的常见任务，本文研究了混合类型数据集下基于 k 最近邻的 CMI 估计器，并提出了一种新的方法，该方法不将类别变量视为数值变量，数值实验结果显示我们的变体能更稳定地检测不同数据分布和预处理类型下的依赖关系。

Oct, 2023

在离散化存在的条件独立性检验

在只有离散观测值的情况下，该研究提出了一种能适应离散变量存在的条件独立性检验方法，通过设计桥接方程来恢复潜在连续变量的统计信息参数，并导出了适当的检验统计量及其在条件独立的零假设下的渐近分布，理论和实证验证结果表明了该方法的有效性。

Apr, 2024

测试离散分布的条件独立性

研究了离散分布的条件独立性检验问题，并给出了样本复杂度的上下界，提出了第一种具有次线性样本复杂度的条件独立性测试器，用于对分布属性进行测试。

Nov, 2017

基于随机投影和距离协方差的统计和数值高效独立检验

使用随机投影和距离相关性基础上的独立性测试方法 RPDC，其计算复杂度为 O (nKlogn)，在多元情况下表现良好，并具有与最先进的距离方法近乎相同的功率。

Jan, 2017