Feb, 2024

理解大型语言模型开发背后的数据集实践者

TL;DR对于发展中的大型语言模型,数据集从业人员的职责是什么?这篇论文通过回顾性分析和半结构化访谈,发现数据质量是最重要的因素,但对于数据质量的定义和评估方法缺乏一致性,论文讨论了这一现象的潜在原因和整合的机会。