Jun, 2024

在平衡数据以实现公平性或鲁棒性时,注意图形

TL;DR机器学习中公平性或鲁棒性的失败可能源于协变量、结果和辅助因素之间的不希望的依赖关系。数据平衡是缓解这些问题的常见策略,但往往无法选择性地消除任务的因果图中的不希望依赖关系,导致多种失败模式,甚至干扰正则化等其他缓解技术。因此,在进行数据平衡之前,考虑因果图是非常重要的。