Dec, 2022

在复杂结构化,多对象和自由文本注释任务中通常测量标注者的一致性

TL;DR本研究探讨了复杂注释任务的 IAA 测量设计与评估,评估跨越了图像边界框、文本序列标记、排名列表、自由文本翻译、数值向量和语法树等 7 个多样化任务,并提出了两种新颖的 IAA 测量方法,显示它们在任务和注释距离函数之间产生了更一致的 IAA 测量。