- KDD一尺之法:面向多种敏感属性的公正图神经网络学习
最近的研究强调了图神经网络(GNN)中的公平性问题,即 GNN 针对被敏感属性(如种族和年龄)分类的特定保护群体产生了歧视性预测。针对这个问题的不同努力取得了显著进展,但往往专门针对特定的敏感属性,因此需要从头开始对模型进行重新训练以满足敏 - 因果扩散自编码器:通过扩散概率模型实现反事实生成
提出了 CausalDiffAE,一种基于扩散的因果表示学习框架,能够根据指定的因果模型实现反事实生成,并通过编码器从高维数据中提取语义上有意义的因果变量,以及使用神经网络参数化潜在因果变量之间的因果机制。
- 分布一致性的结构因果模型
在因果建模领域,潜在结果和结构因果模型是主要框架。然而,这些框架在实际建模反事实时面临着明显的挑战,形式化表现为潜在结果的联合分布参数。本文通过对潜在结果和结构因果模型在建模反事实中的研究,提出了 “退化反事实问题” 这一内在模型容量限制, - 减轻二元分类中的非线性算法偏差
该论文提出使用因果建模来检测和减轻与受保护属性非线性相关的算法偏差。我们使用了 UC Irvine 机器学习库中提供的 German Credit 数据集来开发 (1) 一个被视为黑盒的预测模型和 (2) 用于偏差减轻的因果模型。我们聚焦于 - 药物安全监测的因果预测模型:万古霉素引起的急性肾损伤诊断
通过观察性数据,我们使用因果建模方法估计了患者住院期间药物不良事件的因果概率下界 (PC₋ₗₒw),该方法包括目标试验仿真框架和使用机器学习估计个体化治疗效果的两个主要因果推理组成部分,并将我们的方法应用于临床上重要的用例 ——ICU 患者 - 使用因果建模检测和减轻二元分类中的算法偏见
利用因果建模来检测和减轻算法偏差,本文针对性别偏见和二分类问题,使用成年人数据集通过建立预测模型和因果模型,证明了预测模型中的性别偏见在 0.05 水平上显著,并通过交叉验证展示了因果模型减轻性别偏见的效果并略微提高了整体分类准确度,该方法 - 使用 DiscoSCMs 回答第 3 层查询
该论文介绍了因果建模框架中的反事实退化问题,并提出了 DiscoSCM 框架作为解决方案,该框架结合了潜在结果和结构因果模型的优势,并展示了在单位选择问题上的出色表现。
- 具有竞争选择的因果战略学习
我们研究了多个决策者下因果战略学习中的代理选择问题,并解决了相应的两个关键挑战。首先,我们考虑了代理评估和选择过程的影响,发现最佳选择规则在选择最佳代理和提供激励以促进代理改善之间存在权衡。此外,最佳选择规则依赖于代理结果的错误预测。然后, - Py-Tetrad 和 RPy-Tetrad: 适用于 Tetrad 因果搜索的具备 R 支持的新 Python 接口
我们为 Java 的 Tetrad 项目提供了新颖的 Python 和 R 接口,用于因果建模、搜索和估计。使用 JPype 和 Reticulate 将 Python 和 R 与 Tetrad 接口连接是直接解决这些问题的新方法。
- 使用 Tsetlin 机从数据中生成贝叶斯网络模型
本文提出了一种初步的探索网络结构的方法,该方法利用了 Tsetlin Machines 进行 Bayesian Networks 建模并处理相关性和因果关系。
- WWWCAM2: 面向合规性的多任务排序模型,用于大规模推荐系统
提出了一个适用于大规模工业推荐系统的 CAM2 模型,该模型利用因果建模来区分用户对流行产品的从众效应和他们的真实兴趣,目的是更好地为用户推荐相关物品。通过离线评估和在线实验,发现 CAM2 模型能够有效提高用户参与度和活跃用户量。
- 发展可信人工智能系统中因果作用的评述
本文综述了因果方法对于提高可信 AI 解决方案的应用和发展,因为现有的 AI 模型大多缺乏对人类真实世界理解的因果关系的认识,从而导致了模型泛化性能差、不公平以及难以解释等问题。
- 通过 NOTEARS 评估因果结构学习中的专家知识引导效果
本研究考察了外界专家知识增强因果关系挖掘模型的影响,结果表明校准模型错误的知识可以显著提高挖掘效果,对于挖掘因果关系而言,对影响边的约束比对非影响边的约束对性能的提升更为显著。
- 稀疏排列算法的贪心放松
本研究使用排列推理的方法来搜索有向无环因果模型,并在后者的基础上开发了一类算法,即 GRaSP,通过置换操作 tuck 使其更为高效和稳健,能够在对符合因果性条件的假设要求较弱的情况下进行点差一致性的搜索,性能优于很多现有的因果搜索算法,尤 - ICML利用反事实链接进行链接预测的学习
本文就缺失链接预测问题提出了一种新的数据增强算法,采用因果模型来创建反事实链接,并结合观察链接和反事实链接学习图的表示,实验表明该方法在链接预测任务上具有最先进的性能。
- 减轻偏见放大的去混淆推荐
该论文研究了推荐系统中偏见放大的原因,提出了一种基于因果模型的 Deconfounded Recommender System(DecRS)来解决这一问题,并在两个基准测试上验证了其优越性。
- KDD使用 Shapley Value 进行模型解释的预测和因果推论
本文探讨了 Shapley 值在贝叶斯网络框架下的应用,分析了 Shapley 值与条件独立性的关系,并发现高 Shapley 值的变量不一定对模型预测性能有显著影响,而低 Shapley 值的变量可能会导致较差的预测结果。因此,在一般情况 - 因果生成领域自适应网络
本文提出了一种灵活的生成领域自适应网络 (G-DAN) 和因果生成领域自适应网络 (CG-DAN),旨在通过建模特征的生成过程和使用低维潜在变量,学习和处理源域和目标域之间的分布变化,进而实现跨领域数据生成和预测。实验结果表明,这两种方法在 - 2016 年美国总统选举期间 Twitter 上虚假新闻的影响
本文通过对 2016 年美国总统选举前五个月的 1.71 亿条推特进行分析,确定其中包含 2.2 百万用户链接新闻网站,找出了其中传播虚假新闻和极度偏见新闻的 25%,并揭示了虚假新闻对选举结果的影响。
- ICML学习独立的因果机制
通过模拟物理机制,我们开发出一种无监督学习的算法,能够从变换后的数据点中恢复出一组相互独立的机制,并且这些机制可以移植到新的领域中,对于迁移学习有重要的启示和应用。