May, 2024

走向真实世界的去偏:对伪相关性进行细粒度分析

TL;DR在现实世界的情景转移面临时,训练数据中的虚假相关性显著影响机器学习模型的泛化能力。通过细粒度的数据集偏见分析框架,我们观察并理论上证明现有基准对真实世界中的偏见表示不足。提出了两个新的有偏分布来弥合这一差距,形成了一个细致的真实世界去偏评估框架。通过全面分析,我们提出了一种名为 DiD(Debias in Destruction)的简单而有效的方法,它可以轻松应用于现有的去偏方法,并通过实证结果证明了 DiD 的优越性,提高了现有方法在所提出的评估框架中对所有类型的偏见的性能。