Jan, 2024

大语言模型标注资源节约的有监督微调实验设计框架

TL;DR我们提出使用实验设计来缓解 SFT 的标注成本,并避免在 LLM 的背景下应用主动学习的计算瓶颈。我们的方法在生成任务中实现了与随机抽样所需注释成本相同的泛化性能,仅需 50% 的注释成本。