Apr, 2024

从非线性多环境数据挖掘不变性:二元分类

TL;DR在多个训练环境中给出数据的情况下,如何在未知环境中进行预测是一项具有挑战性的任务。我们从不变性的角度来解决这个问题,着重研究二元分类以揭示一般非线性的数据生成机制。我们发现了一种仅存在于二元情况下的独特不变性形式,使我们能够训练在不同环境中都保持不变的模型。我们提供了这种不变性的充分条件,并证明在环境条件变化很大的情况下它是稳健的。我们的建模方法允许有因果解释,使我们能够将其与各种框架进行比较。最后,我们提出了一种基于启发式的预测方法,并使用真实和合成数据集进行了实验。