Jul, 2023

野外数据集标注质量管理分析

TL;DR文章调研了自然语言数据集创作的质量管理实践,分析了 591 个科学出版物并发现了其普遍存在的错误和 30% 的工作只达到了次级水平,尤其在使用标注错误率和计算注释错误率方面存在常见错误。