在线学习因果模型

Jun, 2020

Learning Causal Models Online

Khurram Javed, Martha White, Yoshua Bengio

TL;DR通过检测和去除虚假特征来间接发现因果模型，以加强预测模型的鲁棒性和泛化能力，并说明问题的时间结构信息对于在线检测虚假特征至关重要。

Abstract

predictive models -- learned from observational data not covering the complete data distribution -- can rely on spurious correlations in the data for making predictions. These correlations make the models brittle

predictive models spurious correlations causal structures online continual learning temporal structure

发现论文，激发创造

持续特征选择：在持续学习中排除虚假特征

本研究探讨了虚假特征对于连续学习算法的影响，发现连续学习算法通过选择无法概括的特征来解决任务。实验表明，连续学习算法面临两个相关问题：（1）虚假特征和（2）局部虚假特征。本文提供了一种不同的理解连续学习性能下降的方式，强调了（局部）虚假特征在算法性能中的影响。

Mar, 2022

因果效应正则化：自动检测和去除假冒属性

本文提出了一种方法，通过估计标签对因果效应的影响来自动识别虚假属性，并使用正则化目标来减轻分类器对它们的依赖性，优于先前方法，特别是在虚假相关性高的情况下，并在噪声影响下缓解了对虚假属性的依赖。

Jun, 2023

虚假相关性及其发现

数据驱动的学习中出现虚假相关性，我们通过合并推导虚假相关性的指标，研究它们对基于 ERM 基线模型的影响，并从因果图生成的合成数据集中观察连接这些假设和模型设计选择的模式。

Aug, 2023

重新审视领域通用性中的伪相关

建立结构因果模型以避免机器学习模型学习到的伪相关性，对应用场景选择正确的伪相关性机制，通过引入倾向性评分加权估计器控制混杂偏差，有效地进行欠分布外泛化。

Jun, 2024

预测模型可用于因果推断吗？

本研究考虑了在有因果关系的影响下，监督机器学习和深度学习算法能否在解释性和预测性之间实现平衡，并表明这种平衡可以通过紫珀（Pearl）的后门调整准则来实现。使用这种方法，不仅可以获得准确的预测，同时也可以大大提高模型的解释性和迁移性。

Jun, 2023

控制学习效应以减少文本分类器中的错综相关性

本文提出了一种利用因果推断的方法实现自动化数据增强，从而减少机器学习模型学习特征和标签之间虚假相关性的问题，并在毒性数据集和 IMDB 评论数据集上得到了明显提升。

May, 2023

非线性不变风险最小化：一种因果方法

提出了一种不变因果表示学习 (iCaRL) 方法，通过利用广义指数族分布得出数据表示，可以在非线性场景中实现超出分布的泛化，并发现目标的全部直接原因，针对合成和真实数据集提出性能优于基线方法的实验结果。

Feb, 2021

通过反事实和不变数据生成实现强健的分类模型

该研究针对机器学习应用中存在的假相关问题，以图像分类为例，提出两种数据生成策略来减少此类问题，并在多个领域的数据集上表现出更好的准确性和更好的解释能力。

Jun, 2021

因果结构学习

本文研究了关于基于数据学习因果模型的结构学习算法，比较了它们在不同场景下的实验性能表现。

Jun, 2017

学习独立的因果机制

通过模拟物理机制，我们开发出一种无监督学习的算法，能够从变换后的数据点中恢复出一组相互独立的机制，并且这些机制可以移植到新的领域中，对于迁移学习有重要的启示和应用。

Dec, 2017