Sep, 2023

偏见放大提升少数群体表现

TL;DR基于引入可学习的辅助变量的 BAM 算法通过扩大偏差,训练模型并在重新加权数据集上继续训练,从而在计算机视觉和自然语言处理的虚假相关基准测试中取得了竞争性的性能,同时发现基于最小类别准确率差异的简单停止准则可以消除对群组注释的需求,或者在最差组准确率上几乎没有损失。