May, 2023

通过扩大高质量的指导性对话提升聊天语言模型

TL;DR本文介绍了通过 fine-tuning instruction data 实现 ChatGPT 之类聊天语言模型的有效性,提出了一个系统设计的、不涉及人类查询、包含 150 万高质量多轮对话的 UltraChat 聊天数据集,使用该数据集 fine-tune 了 LLaMA 模型得到了更好的性能表现,成为领先的开源数据集。