BriefGPT.xyz
Oct, 2023
提升大型语言模型的数据生成能力
Making Large Language Models Better Data Creators
HTML
PDF
Dong-Ho Lee, Jay Pujara, Mohit Sewak, Ryen W. White, Sujay Kumar Jauhar
TL;DR
本文提出了一种统一的数据创建流程,只需一个格式示例,适用于包括传统上问题较多的任务在内的广泛范围,通过实验证明使用指令跟随型大型语言模型创建的数据比使用人工标注的数据在分布外评估上表现更好(高达17.5%),同时在分布内任务上保持可比较的性能,这些结果对于在现实世界中部署的自然语言处理系统的稳健性具有重要意义。
Abstract
Although
large language models
(LLMs) have advanced the state-of-the-art in NLP significantly, deploying them for
downstream applications
is still challenging due to cost, responsiveness, control, or concerns aro
→