Feb, 2024

数据标注的大型语言模型调查

TL;DR数据标注是提高机器学习模型效果的标记或标签化原始数据的过程,使用大型语言模型(LLMs)可以革新和自动化数据标注过程。本研究着重于LLM在数据标注中的特定用途,探讨了LLM基于数据标注、评估LLM生成的标注以及使用LLM生成的标注进行学习的方法。此外,还提供了LLM在数据标注中的方法学分类、包含LLM生成标注的模型的学习策略综述,并详细讨论了使用LLM进行数据标注所面临的主要挑战和限制。本文旨在为研究人员和从业者指导利用最新的LLMs进行数据标注,推动该关键领域的未来发展。