- 贝叶斯加法回归树中大数据的计算困境:一个命中时间分析
Bayesian 加法回归树模型(BART)是一种常用的贝叶斯非参数回归模型,广泛应用于因果推断等领域。然而,本文表明 BART 采样器的收敛速度往往较慢,尤其在具有离散协变量的情况下。随着训练样本的增加,近似 BART 后验与精确后验逐渐 - KDD潜变量因果推断:最新进展与未来前景
通过综述研究,我们对近期在潜变量条件下的因果推断相对于影响因素进行了全面的回顾,涵盖了因果效应估计、中介分析、反事实推理和因果发现等任务,并介绍了在大型语言模型时代下因果推断存在的新机会。
- 将模糊逻辑与因果推断相结合:增强 Pearl 和 Neyman-Rubin 方法
本文介绍了一种模糊因果推理方法,利用模糊逻辑综合了 Pearl 和 Neyman-Rubin 方法,考虑了数据的模糊性和不确定性以及模糊术语如 “高”、“中” 和 “低” 所表达的主观人类观点。通过引入两个模糊因果效应公式:Fuzzy Av - 非因果预测模型的因果微调和效果校准
通过使用实验数据改进非因果推断的非因果模型以提高性能,并展示了其在不同因果任务中的有效性和实际应用优势。
- Q - 函数之差的正交估计
离线强化学习是许多具有可用观测数据但由于安全、成本和其他方面的考虑而无法在线部署新策略的设置中的重要问题。本文提出了 R-learner 的动态推广,用于估计和优化 Q 函数之间的差异,方法可以利用黑盒辅助估计器和行为策略来估计更结构化的 - 基于反事実的动态系统根本原因分析
通过使用残差神经网络对动态因果系统进行建模,并得出相应的反事实轨迹分布,我们解决了现有因果方法在确定根本原因时的问题,该方法对静态环境有限且注重导致故障的外部影响,而非结构影响。我们提出的方法在动态系统基准和真实世界河流数据集上具有有效性。
- DecoR:使用鲁棒回归解除时间序列中的混杂
通过在频域内使用鲁棒线性回归,估计由第三个未观测时间序列混淆的两个时间序列之间的因果效应。
- 面板数据中的异质处理效应
利用回归树对面板数据进行分析,将观测值划分为具有相似治疗效果的不相交簇,并利用面板数据的低秩结构估计每个簇的平均治疗效果,提供更准确和可解释的估计结果。
- ICML学习发散场以获得偏移鲁棒的图表示
我们提出了一个可学习的发散场几何扩散模型来解决依赖关系数据的挑战性泛化问题。通过引入随机扩散性来广义扩散方程,旨在捕捉依赖关系数据之间的多方面信息流动。另外,通过因果推断导出了一种新的学习目标,可指导模型学习对不同领域中都无关的依赖关系模式 - MMROS-Causal 在真实世界人机空间交互场景中的实验评估
在人类共享环境中部署机器人需要对附近的代理和物体的互动进行深入理解。利用因果推断模型因果关系有助于预测人类行为并使机器人干预成为可能。本研究评估了 ROS-Causal,在模拟和实验室场景中进行数据集的性能和效果分析,证明了该方法的有效性, - 调和因果推断中的异质效应
通过采用 Reconcile 算法解决了因果推断中的参考类问题,通过协调异质效应中的模型多样性,解决了个体概率估计中的差异,从而确保公平结果,并强调了算法公正性的整体方法的重要性。
- 因果推断的双重稳健学习教程
该论文介绍了双重稳健学习方法,旨在通过整合倾向得分和结果建模来从观测数据中进行因果推断。通过使用 EconML 软件包演示其应用,该论文消除了双重稳健方法的复杂性,并提供了实际的编程示例,旨在使数据科学和统计学的研究人员和从业人员可以更便捷 - 用于评估延迟系统的因果框架
通过因果推断的方法,评估延迟系统对预测准确度的因果影响,区别两种场景,一种是能够接触到人类和机器学习模型的预测结果,另一种是只有人类预测结果可用,通过这种方法在合成和真实数据集上对七种延迟系统进行了实证评估。
- 混合治疗效果的合成潜在结果
现代数据分析中常常依赖于使用大型数据集,其中包含多个不同的人群或数据源的综合。这些较小数据集之间的异质性构成了因果推断的两个主要挑战:(1)每个样本的来源可能会引入处理和效果之间的潜在混淆,(2)不同的人群对相同的处理可能会产生不同的反应, - 从单变量干预推导因果顺序:保证与算法
根据数据分布的实际假设,本研究引入了干预忠实度的概念以及一种用于推断因果关系的得分,同时提出了一种名为 Intersort 的算法,能够从包含大量单变量干预的数据集中近似地优化因果顺序,为进一步改进因果推断提供了重要的潜力。
- 机器学习对自然科学是利是弊?
机器学习(ML)在各个科学领域产生了巨大的影响,然而,ML 具有强大的本体论和认识论,在自然科学中与标准实践和关键哲学观念存在强烈冲突。本文识别了 ML 在自然科学中的一些有价值的应用领域,如使用表达能力强的机器学习模型进行因果推断来表示混 - 多 CATE: 对未知协变量转变健壮的多准确条件平均处理效应估计
通过学习多准确性预测器,我们提出了一种方法,用于在部署时解决未知协变量转变,从而改善异质处理效应预测,并在因果推断和机器学习中取得了令人满意的结果。
- 因果下游任务中的幻象与虚假
机器学习和人工智能有潜力改变数据驱动的科学发现,通过准确预测多种科学现象。本文通过对治疗效果估计的因果推断任务进行研究,其中假设记录为高维图像的二元效果是在随机对照试验中进行的。我们发现,尽管这是最简单的设置且完全适合深度学习,但在文献中的 - 从视觉语言模型中学习不变的因果机制
我们提出了 CLIP-ICM(Invariant Causal Mechanism of CLIP)算法,该算法旨在通过干预数据来可靠地识别不变的潜在因素,并在各个领域中实现准确的预测。理论分析表明,我们的方法在分布外(OOD)场景中具有较 - KDD隐藏混淆下的共形反事实推断
个性化决策需要对不同处理方法下的潜在结果有所了解,并且关于潜在结果的置信区间能够丰富决策过程并提高其在高风险场景下的可靠性。本研究提出了一种基于推断加权拟合预测的新方法 wTCP-DR,他能够在存在隐性混淆的情况下提供对反事实结果的置信区间