基于最近邻采样的条件独立性检验
提出了一种基于条件互信息和局部置换方案的全非参数连续数据测试方法,能够适应强非线性相关性,表现优于基于核的测试,并在小样本和高维条件下可靠地模拟零分布。
Sep, 2017
针对连续随机变量,我们将条件独立性检验转化为分类问题并实现了非参数化的方案,通过最近邻引导采样策略生成训练样本,并提出一种大型数据集上性能更好的算法,从而实现有效测试。
Sep, 2017
研究了在条件分布连续的情况下,基于条件独立性测试 $X$ 和 $Y$ 关于 $Z$,$X$ 和 $Y$ 均为离散或连续变量的问题。考虑到条件独立性测试的研究,对于所有绝对连续的条件分布都无法设计非平凡的测试以控制所有的一类错误并确保在有趣的替代情况下仍然具有功效,因此在条件分布的各个自然光滑性假设下研究了条件独立性测试的难度,并以总变差度量指标的临界分离半径为下界和上界。最后,提供了一种新的证明方法以证明 Shah 与 Peters 的结论。
Jan, 2020
本研究探讨在差分隐私的约束下的条件独立性检验,设计了两种基于广义协方差度量的私有 CI 检验以及基于 Candës 等人的条件随机化检验(在模型 - X 假设下),这是第一种适用于 $ Z $ 为连续型变量的私有 CI 检验。
Jun, 2023
该研究提出了两种基于随机特征的条件独立性检验方法 RCIT 和 RCoT,它们可以近似替代 KCIT,在大样本情况下比 KCIT 更快更准确,同时应用于 CCD 算法可以提高算法的运行效率。
Feb, 2017
提出了一种称为 MINT 的新方法,该方法基于互信息的估计,并使用从最近的邻居距离导出的有效熵估计器,从而便于将互信息分解为联合和边际熵,用于检验两个多变量随机向量的独立性,并可将其扩展为基于测量协变量向量与误差向量独立性的新正态线性模型是否适配的卡方检验,并在模拟和真实数据上进行了数值研究。
Nov, 2017
条件独立性检验是机器学习中的常见任务,本文研究了混合类型数据集下基于 k 最近邻的 CMI 估计器,并提出了一种新的方法,该方法不将类别变量视为数值变量,数值实验结果显示我们的变体能更稳定地检测不同数据分布和预处理类型下的依赖关系。
Oct, 2023
在只有离散观测值的情况下,该研究提出了一种能适应离散变量存在的条件独立性检验方法,通过设计桥接方程来恢复潜在连续变量的统计信息参数,并导出了适当的检验统计量及其在条件独立的零假设下的渐近分布,理论和实证验证结果表明了该方法的有效性。
Apr, 2024
使用随机投影和距离相关性基础上的独立性测试方法 RPDC,其计算复杂度为 O (nKlogn),在多元情况下表现良好,并具有与最先进的距离方法近乎相同的功率。
Jan, 2017