Feb, 2024

数据标注的大型语言模型调查

TL;DR数据标注是提高机器学习模型效果的标记或标签化原始数据的过程,使用大型语言模型(LLMs)可以革新和自动化数据标注过程。本研究着重于 LLM 在数据标注中的特定用途,探讨了 LLM 基于数据标注、评估 LLM 生成的标注以及使用 LLM 生成的标注进行学习的方法。此外,还提供了 LLM 在数据标注中的方法学分类、包含 LLM 生成标注的模型的学习策略综述,并详细讨论了使用 LLM 进行数据标注所面临的主要挑战和限制。本文旨在为研究人员和从业者指导利用最新的 LLMs 进行数据标注,推动该关键领域的未来发展。