Sep, 2022
数据反馈环路:基于模型驱动的数据集偏差放大
Data Feedback Loops: Model-driven Amplification of Dataset Biases
Rohan Taori, Tatsunori B. Hashimoto
TL;DR本文旨在通过记录模型与数据的交互过程,以改善未来爬取的 Internet 数据集的信息稳定性。我们发现模型输出表现为源自训练集的样本具有一致性校准时,偏见放大的程度与模型预测的性别偏差等测试时偏差统计显著相关,如果同时在三个条件预测场景中使用,能更好的校准和稳固反馈系统。