本文提出了一种机器学习模型稳健性的框架,通过人类关于因果关系的常识知识来解决模型在训练和测试过程中的不一致性问题。透过在每个训练数据中加入人类标注的潜在未测变量,将问题转化为协变量转移问题,并引入分布稳健优化目标来控制测试时偏移的最坏情况损失,实验结果表明,在具有旋转混淆的数字识别任务和分析 NYPD 警务巡逻地点混杂的任务中能获得 5-10% 和 1.5-5% 的性能提升。
Jul, 2020
通过引入因果选择图的先验知识,该研究提出了一种主动学习方法,将不稳定性机制产生的变量从联合因式分解中删除,从而得到不变于不同环境中差异的干预分布 —— 手术估计器,比之前仅考虑条件关系的方法在严格更多的场景下找到了稳定的关系,并在真实世界数据上表现出与完全数据驱动方法有竞争力的结果。
Dec, 2018
通过因果干预的方式,使用多个视网膜中心数据增强和线性响应空间插值,促进模型学习因果特征而提高其抗干扰能力,并以此为基础设计了一种集成了 Causal intervention by instrumental Variable (CiiV) 技术的训练方法,在 CIFAR-10、CIFAR-100 和 mini-ImageNet 数据集上对多种适应性攻击具有鲁棒性,适用于提高其他方法的抗干扰能力。
Jun, 2021
本论文提出了多种技术手段,包括对抗训练、语言模型和数据增强等,用于提高模型在因果推理领域的性能和鲁棒性,这些方法均能使模型在 COPA 数据集上有显著改进。
Jan, 2021
本文提出了一种基于不变因果预测的主动学习框架(A-ICP),旨在帮助有效地选择实验以提高因果模型的可识别性,该框架依靠结构因果模型中干预对稳定集合发挥作用,并通过数个干预选择策略得以实现,实证分析证明所提出的策略在不同实验环境下均有良好表现。
Jun, 2020
通过使用因果机制的图形知识,识别具有不稳定的统计影响路径的变量并将其从模型中删除,同时使用潜在反事实变量来隔离不稳定的统计影响路径,可以改进模型的泛化能力和可靠性。
Aug, 2018
本文探讨了如何从多个数据集和关于基础数据生成模型的定性假设组合中学习出强健、通用的预测模型。通过定义不同的不变性特性,我们的方法旨在在未观察到混淆因素的情况下建立因果性的解,从而连接数据分布的一组仿射组合上的显式分布鲁棒优化问题。我们在医疗保健数据上展示了我们方法的实证表现。
本文提出了一种 Stable Adversarial Learning(SAL)算法,该算法通过利用异构数据源构建更实用的不确定性集合,并针对与目标之间的相关性稳定性进行差异化的强鲁棒性优化,在随机梯度优化的情况下证明了可行性和提供了性能保证。该算法的实证研究在模拟和实际数据集上验证了其总体表现较好的有效性。
本文探讨了预防疾病和预防医学中使用的 AI 模型出现问题的重要性,以及分析了一个 Kaggle 竞赛用例 - X 射线肺图像异常检测中的数据不平衡性问题,并说明了如何通过在整个生命周期中监测数据和模型平衡性来消除偏见。
May, 2023
提出了一种基于肺部空腔边缘提取的轮廓注意力保持方法来提高由于医学复杂纹理特征挑战而难以泛化的医学成像领域中的计算机断层扫描图像 AI 诊断系统的鲁棒性和推广能力。
Nov, 2022