本研究探讨了虚假特征对于连续学习算法的影响,发现连续学习算法通过选择无法概括的特征来解决任务。实验表明,连续学习算法面临两个相关问题:(1)虚假特征和(2)局部虚假特征。本文提供了一种不同的理解连续学习性能下降的方式,强调了(局部)虚假特征在算法性能中的影响。
Mar, 2022
本文提出了一种方法,通过估计标签对因果效应的影响来自动识别虚假属性,并使用正则化目标来减轻分类器对它们的依赖性,优于先前方法,特别是在虚假相关性高的情况下,并在噪声影响下缓解了对虚假属性的依赖。
Jun, 2023
数据驱动的学习中出现虚假相关性,我们通过合并推导虚假相关性的指标,研究它们对基于 ERM 基线模型的影响,并从因果图生成的合成数据集中观察连接这些假设和模型设计选择的模式。
Aug, 2023
建立结构因果模型以避免机器学习模型学习到的伪相关性,对应用场景选择正确的伪相关性机制,通过引入倾向性评分加权估计器控制混杂偏差,有效地进行欠分布外泛化。
Jun, 2024
本研究考虑了在有因果关系的影响下,监督机器学习和深度学习算法能否在解释性和预测性之间实现平衡,并表明这种平衡可以通过紫珀(Pearl)的后门调整准则来实现。使用这种方法,不仅可以获得准确的预测,同时也可以大大提高模型的解释性和迁移性。
本文提出了一种利用因果推断的方法实现自动化数据增强,从而减少机器学习模型学习特征和标签之间虚假相关性的问题,并在毒性数据集和 IMDB 评论数据集上得到了明显提升。
May, 2023
提出了一种不变因果表示学习 (iCaRL) 方法,通过利用广义指数族分布得出数据表示,可以在非线性场景中实现超出分布的泛化,并发现目标的全部直接原因,针对合成和真实数据集提出性能优于基线方法的实验结果。
Feb, 2021
该研究针对机器学习应用中存在的假相关问题,以图像分类为例,提出两种数据生成策略来减少此类问题,并在多个领域的数据集上表现出更好的准确性和更好的解释能力。
Jun, 2021
本文研究了关于基于数据学习因果模型的结构学习算法,比较了它们在不同场景下的实验性能表现。
Jun, 2017
通过模拟物理机制,我们开发出一种无监督学习的算法,能够从变换后的数据点中恢复出一组相互独立的机制,并且这些机制可以移植到新的领域中,对于迁移学习有重要的启示和应用。
Dec, 2017