- CELLO: 大型视觉 - 语言模型的因果评估
通过细致而统一的因果关系定义以及涉及人类与 / 或物体之间相互作用的显式因果图,本论文构建了一个名为 CELLO 的新数据集,并表明当前的大规模视觉语言模型在因果推理任务上依然面临困难,但可以从提出的因果启发式思维提示策略 CELLO-Co - CLEAR: 语言模型真的能理解因果图吗?
通过开发一个框架来定义因果图的理解,并且通过多个学科的实际标准评估语言模型的行为,我们开展了语言模型理解因果图的研究,并开发了一个包括 20 个任务的新的基准。通过对六个主要语言模型进行广泛实验,我们总结了五个实证发现,结果表明语言模型对因 - LLMs 在因果推断上容易出现谬误
本研究通过合成数据对预训练语言模型进行微调,验证了模型对于从文本中推断因果关系的能力,发现模型容易根据实体在文本中的出现顺序推断因果关系,但在因果关系推断方面存在后验谬误,且对于反事实关系的推断较为困难,从而对模型对因果关系的理解提出了质疑 - ICML可扩展和灵活的因果发现与有效的邻接测试
通过训练神经网络,我们建立了一种名为 Differentiable Adjacency Test(DAT)的方法,用以评估两个变量是否相邻于因果图。基于 DAT,我们构建了一种名为 DAT-Graph 的图学习方法,可以从数据中学习具有 1 - 混合有向无环图中的干预因果发现
通过干预来学习混合因果模型中变量之间的因果关系是一项具有挑战性的任务,本文提出了匹配性的必要和充分条件以及一种自适应算法,用于学习混合因果模型中的所有真实边,具有最佳干预效果并在混合模型不包含循环关系时尺寸最小。
- 基于约束的因果发现的大型语言模型
本文研究了大型语言模型在生成因果图方面的能力,通过将条件独立性查询作为 LLM 的提示并与 PC 算法的答案结合,提出了一种基于统计启发的投票模式来改善性能,并发现因果推理可以用于对概率查询进行合理解释,从而证明了基于知识的因果推理可能成为 - 潜在混淆变量的总效应在总结性因果图中的可识别性:基于前门准则的扩展
使用摘要因果图从观测数据中确定总效应的充分图形条件,即使存在隐藏的混杂和没有足够的变量集进行调整,也有助于从观测数据中理解和估计因果效应的持续努力。
- ICML适应性在线实验设计用于因果推断
在线学习中基于干预样本历史的分离图系统相匹配的追踪停止因果发现算法优于现有方法,通过较少的样本实现更高准确性的因果图学习。
- 自标注的多变量因果关系与自适应机器学习的量化
自适应机器学习应用于变化环境下的模型自适应,通过实现与因果相关的数据流自我标记方法,结合多变量因果关系和辅助模型的应用,提出了针对多变量因果图的自标记应用框架及评估方法。
- 用大型语言模型叙述因果图
使用生成性人工智能从因果图生成文本描述的能力得到了实证调查,发现相对于基于事实的图形,因果文本描述在零 - shot 设置下更难生成,但使用少量示例进行模型训练与通过大型策划数据集进行微调获得类似的性能。
- 通过独立性查询预测马尔可夫等价类中的成员资格
推理因果关系、统计图模型、条件独立测试和学习之间的关系及其几何解释。
- CORE: 基于强化学习的可扩展高效因果发现
该研究提出了一种基于深度强化学习的 CORE 方法,用于因果发现和干预计划。CORE 能够从数据中顺序地重建因果图,并学习执行信息丰富的干预策略,其在结构估计准确性和样本效率方面优于现有方法,并且能够适应更大的图形结构。
- AAAI文本的零 - shot 因果图外推通过 LLMs
通过大型语言模型 (LLMs) 从自然语言中推断因果关系,并借助成对查询对因果图进行扩展,初始分析在生物医学文摘的基准上进行,结果有希望且支持在因果推断中采用 LLMs,尤其是在科学文本庞大且因果陈述经常隐含的医学领域。
- CLadder: 评估语言模型因果推理能力的基准
通过创建一个新的自然语言处理任务,基于因果图和问题,研究大型语言模型在因果推理方面的能力,并提出一种特定的激励策略来评估和分析这种推理能力。
- 潜空间中干扰变量的因果结构表示学习用于推荐
用户偏好、推荐系统、混淆因素、因果图和潜在空间是本研究的关键词,研究探讨了混淆因素对用户偏好的影响和如何在潜在空间中建模,通过因果图的方式分离混淆因素和用户偏好。最后,提出了基于变分自动编码器的模型,命名为潜在空间中混淆因素的因果结构表示学 - ICML虚假相关性及其发现
数据驱动的学习中出现虚假相关性,我们通过合并推导虚假相关性的指标,研究它们对基于 ERM 基线模型的影响,并从因果图生成的合成数据集中观察连接这些假设和模型设计选择的模式。
- OCDaf:使用自回归流进行有序因果发现
我们提出了一种名为 OCDaf 的新型基于顺序的方法,用于从观测数据中学习因果图,并在多元异方差噪声模型中建立了因果图的可辨识性,通过连续搜索算法寻找因果结构,实验结果在 Sachs 和 SynTReN 基准测试中表现出了最先进的性能,并且 - 可伸缩因果边界的计算
计算具有未观察到的混淆变量和离散值观察变量的因果图上的因果查询的边界的问题,我们显示线性规划可以被大大剪枝,使得我们能够解决较大规模的因果推断问题,以及提出了高效的贪心算法用于推断无额外观测变量的因果边界。
- 一种比较因果图的连续结构干预距离
我们提出了一种基于嵌入干预分布的连续测量度量,用于衡量真实因果图与学习到的因果图之间的差异,该度量考虑了图结构之外的底层数据,通过最大(条件)均值差异来估计它们的差距。我们在合成数据上进行数值实验证实了我们的理论结果。
- 自我兼容性:无需基准事实进行因果关系探索的评估
通过测试不兼容性来检测错误推断的因果关系,以支持因果模型的选择,并提供了因果发现算法在模拟数据中的评估方法。