Sep, 2024

多样性类识别自我训练:缓解选择偏差以实现更公正的学习

TL;DR本研究针对机器学习中的选择偏差问题,该偏差通常导致模型对性别或年龄等敏感特征的偏见。提出了一种新的方法DCAST,通过增强样本多样性,利用未标记样本改善基础人口的表示,同时有效识别和缓解复杂数据中的未识别偏差,从而在多个数据集上展现出更强的鲁棒性和公平性。