May, 2023

当大多数人都错了:利用注释者的分歧来完成主观任务

TL;DR针对网络暴力检测中的数据标注员意见分歧问题,提出了一种预测个体标注员评估与目标群体意见的模型,并通过结合潜在目标群体与评估进行评估,在预测任务中表现出了 22% 的性能提升和 33% 的模型不确定性预测能力。我们发现,标注员的评估可以通过其在线内容的人口统计信息和意见进行预测,而无需跟踪标注员 ID。同时,我们还发现在预测标注员意见时,使用非侵入性调查问题有助于最大程度保护隐私和最小化不必要的个人信息收集。