- ICML可扩展和灵活的因果发现与有效的邻接测试
通过训练神经网络,我们建立了一种名为 Differentiable Adjacency Test(DAT)的方法,用以评估两个变量是否相邻于因果图。基于 DAT,我们构建了一种名为 DAT-Graph 的图学习方法,可以从数据中学习具有 1 - 基于约束的因果发现的大型语言模型
本文研究了大型语言模型在生成因果图方面的能力,通过将条件独立性查询作为 LLM 的提示并与 PC 算法的答案结合,提出了一种基于统计启发的投票模式来改善性能,并发现因果推理可以用于对概率查询进行合理解释,从而证明了基于知识的因果推理可能成为 - 从时间聚合的独立同分布数据中恢复因果关系的可行性
我们研究了时间聚合对一般设置中即时(非时间)因果发现的影响,发现聚合效果使得时间延迟因果关系消失,即时依赖关系显现。我们提出了功能一致性和条件独立一致性的概念,以形式化的方式对应于基于功能因果模型的方法和基于条件独立的方法,并给出了满足这些 - 通过投注测试语义重要性:我敢打赌你并不是那个意思
我们的研究通过使用特征重要性、语义概念和条件独立性来形式化黑盒预测模型对于全局和局部统计重要性的定义,并通过顺序核化测试的方法对概念进行排序,从而在真实场景中提供了有效性和灵活性的框架。
- 通过神经网络环境分解实现对连续变量的局部独立性发现
通过建模条件分布,本文提出了一种名为神经上下文分解(NCD)的方法,用于发现系统中多个上下文集特定独立性关系,并通过在合成数据集和反映现实世界物理动力学的复杂系统中的实证演示,成功地发现了真实的局部独立性关系。
- 在离散化存在的条件独立性检验
在只有离散观测值的情况下,该研究提出了一种能适应离散变量存在的条件独立性检验方法,通过设计桥接方程来恢复潜在连续变量的统计信息参数,并导出了适当的检验统计量及其在条件独立的零假设下的渐近分布,理论和实证验证结果表明了该方法的有效性。
- CVPR强制条件独立性:公平表示学习和因果图像生成
我们介绍了一种新的训练范式,通过使用动态采样策略,扩展了将条件独立性约束推广到高维特征空间的方法,从而能够在保持等概率性约束的条件下实现任何受保护属性与扩散自动编码器潜在表示的条件独立性,从而实现具有可控潜在空间的因果图像生成,而保持下游任 - ICLR存在缺失情况下的基因调控网络推断:因果视角
基因调控网络推断是一个具有挑战性的问题,尤其是由于单细胞 RNA 测序数据中存在零值:一些是表示没有基因表达的生物学上的零值,而其他一些是由测序过程(也称为缺失)产生的技术性零值,可能通过扭曲所测量的基因表达的联合分布来偏移基因调控网络推断 - 用于随机过程的因果推断中的签名核条件独立性检验
利用基于核函数的条件独立性测试以及基于约束的因果发现算法,本文致力于从随机动力系统中推断因果结构,证明在路径空间中,我们提出的条件独立性测试相较于现有方法表现优秀,并在允许循环的随机动力系统中,利用时间信息恢复出完整的有向图,通过实验证明我 - 内容条件去偏差以实现公平的文本嵌入
在自然语言处理领域,解决机器学习模型中的偏见问题日益受到关注。本文提出了一种学习公平文本嵌入的新方法,通过确保在内容条件下敏感属性与文本嵌入之间的条件独立性,同时实现公平性并保持效用平衡。通过使用大型语言模型将文本扩充为不同敏感组,解决了缺 - 条件独立性的实用核检验
描述了一种数据高效、基于核的条件独立性统计检验方法,通过数据拆分、辅助数据和更简单的函数类别等方法,控制偏差并校正测试水平,适用于合成和真实数据。
- 朴素贝叶斯分类的变量选择
我们提出了一种稀疏版本的朴素贝叶斯分类器,考虑到协变量的相关性,可以使用不同的性能度量来选择特征,并且可以包括对高度相关的组的性能约束。研究结果表明,与其他特征选择方法相比,所提出的稀疏朴素贝叶斯分类器在准确性、稀疏性和运行时间方面都具有竞 - 通过 Cramer-Wold 距离实现联合分布学习
通过引入 Cramer-Wold 距离正则化和两步骤学习方法,本研究在处理高维数据集或观测变量间的复杂相关结构时,改进了变分自编码器 (Variational Autoencoder) 解码模型中存在的条件独立性假设限制,以实现高维数据的联 - 概率图模型的近似蕴涵
本文研究了概率图模型中近似条件独立性的推断和验证问题,发现无向概率图并不能提供准确的条件独立性推断保证,而有向概率图可以通过 $d$-separation 算法准确推断近似条件独立性。此外,还提出了改进的近似保证方法和独立关系推断算法。
- ICML反事实不变性的结果
本文从理论角度分析了反事实不变性的各种定义及其相关性,包括条件独立性是否能证明其强弱程度和可能性。 针对离散因果模型,我们证明了反事实不变函数通常只能是特定变量的函数,甚至是常数。
- 关于充分图模型
将非线性合适降维技术应用于条件独立性评估,引入了一种足够的图模型,该模型在本质上是非参数的,避免了高维核函数引起的维度灾难;通过模拟比较和对 DREAM 4 挑战数据集的分析,证明了该方法在高维设置下,且当高斯或 copula 高斯假设不成 - 基于 Copula 的深层生存模型 —— 用于相关截尾数据的分析
该论文介绍了一种参数化的生存模型,通过放宽条件独立性的假设,扩展现代非线性生存分析并在合成和半合成数据中显著提高了生存分布的估计。
- 利用有限的图知识超越 Markov 等价的前门调整
本文通过提供可测试的条件独立性语句,展示了使用类前门调整来计算因果效应的方法,并证明该方法适用于在有限结构信息的情况下不知道图形的情况下。
- 差分隐私条件独立性检验
本研究探讨在差分隐私的约束下的条件独立性检验,设计了两种基于广义协方差度量的私有 CI 检验以及基于 Candës 等人的条件随机化检验(在模型 - X 假设下),这是第一种适用于 $ Z $ 为连续型变量的私有 CI 检验。
- ICLR可扩展估计非参数马尔可夫网络的广义精度矩阵
使用广义精度矩阵(GPM),在所有数据类型(即连续、离散和混合类型)中表征了条件独立结构,提出了一种 Markov 网络结构学习算法,在处理大型图形时使用正则化评分匹配框架来统一所有情况。