Nov, 2023

评分者分歧的分类:从在线毒性注释角度调查挑战与机遇

TL;DR在线空间中的毒性问题是一个日益普遍且严重的问题,因此,过去十年的机器学习研究重点放在计算检测和缓解在线毒性上。然而,由于历史上此类标注往往存在较低的一致性,最近的研究指出了在构建和利用这些数据集时考虑这一任务的主观性的重要性,并激发了对评定者不一致性进行分析和更好理解以及如何将其有效纳入机器学习开发流程的研究。虽然这些努力填补了重要的空白,但缺乏更广泛的评定者不一致性根本原因的框架,因此我们将这项工作置于更广泛的背景之上。在这篇综述论文中,我们分析了关于在线毒性评定者不一致性原因的大量文献,并提出了详细的分类法。此外,我们还总结和讨论了针对每个不一致性原因的潜在解决方案,并讨论了几个能促进未来在线毒性研究发展的开放问题。