Oct, 2022

瀑布偏差:探讨启发式标注策略对数据和模型的影响

TL;DR本文探讨了在众包平台上进行注释任务时,注释者使用认知启发式对数据质量和模型稳健性的影响,并提出了追踪注释者启发式痕迹以确定使用各种认知启发式的方法。作者发现,注释者可能会使用多种认知启发式,由其决定数据质量并影响模型的鲁棒性。追踪注释者使用认知启发式有可能帮助收集有挑战性的数据集并诊断模型偏差。