本文提出了一种基于深层潜在变量模型和重要性加权变分目标的测量误差下因果推断的方法,使得即使没有测量误差方差和侧面信息,也可以得出可靠的因果效应估计。
Jun, 2023
准确测量在基于机器学习的自动决策系统中的歧视是解决子群体和 / 或个体间公平性的重要问题所必需的。本文关注于在生成和 / 或收集训练数据的方式中出现的一类偏见,我们称之为因果偏见,并使用因果关系领域的工具来正式定义和分析此类偏见。本文考虑了四种来源的偏见,即混杂、选择、测量和交互。本文的主要贡献是为每种偏见提供了一个基于模型参数的闭合表达式。这使得分析每种偏见的行为成为可能,特别是在哪些情况下它们不存在,以及在哪些其他情况下它们被最大化。我们希望提供的特征有助于社会更好地理解机器学习应用中偏见的来源。
Oct, 2023
预测未见干预的效果是数据科学中的一个基本研究问题。本文采用了部分祖先图(Partial Ancestral Graph)作为输入,提供了一种可以在数据驱动环境下计算因果效应界限的系统算法。
Nov, 2023
该论文提出使用矩阵分解来从噪声协变量中推断混淆因素,减少测量噪声引起的偏差,展示了这个方法在合成数据和临床数据上的实验结果。
Jun, 2018
本文综述了在潜在结果框架下,针对观察数据的因果推断方法。这些方法分为两类,包括传统的统计学方法和最新的机器学习方法,还介绍了这些方法在广告、推荐、医学等领域的应用以及常用的基准数据集和开源代码。
Feb, 2020
通过因果关系解释的虚假相关的条件互信息,我们提出了一种信息熵偏差测量技术,可以有效地识别基于特征的算法偏差,并设计了一种新颖的基于偏差正则化损失的去偏差框架和一种基于随机标签噪声的简单而有效的非监督去偏差技术。
Jan, 2022
本文介绍了一种基于测量协变量的局部因果推断框架,其中正式承认协变量测量是难以完美匹配真实混淆机制的,为在基于观测数据的因果推断中提供新的思路。作者提出了一套非参数近端推断的条件,建立了平均处理效应的半参数近端推断理论,以及多种相容性分析方案,并在模拟情境和实际数据集评估中予以展示。
Nov, 2020
本文回顾了计算社会科学中利用文本分析解决因果推论中混淆变量引起偏差的方法,并提出数据处理及评估决策的指南。尽管在利用文本分析进行混淆因素调整方面已取得了进展,但仍存在很多未解决的问题。
May, 2020
研究了寻找因果关系的可靠程序,即使存在潜在变量和选择偏差,通过测量变量之间的依赖关系,可以得出从一个变量到另一个变量的因果路径以及不存在这样的因果路径的可靠条件。
Feb, 2013
本文提出了一个基于共享混杂物和独立治疗的多种治疗估计技术,并使用相互信息对混淆估计器进行正则化,同时使用独立于混淆物的治疗方法中的残留信息来恢复治疗效果,并在模拟和医学临床案例中进行了验证。
May, 2018