Jan, 2024

众包和 LLM 的注释质量比较研究

TL;DR通过对现有众包数据集进行评估,从不同的角度研究了个体众包标签和大语言模型标签的质量,提出了一种众包 - 大语言模型混合标签聚合方法并验证了其性能,发现将优质大语言模型的标签与现有众包数据集相结合能提高数据集的聚合标签质量,且高于大语言模型标签自身的质量。