Aug, 2023

大型语言模型作为用户模拟器

TL;DR通过从真实人机对话中提取的人类问题作为学习目标,我们训练出了用户模拟器UserGPT,产生了高质量的以人为中心的合成对话数据集RealChat。实验结果表明,我们的模型在Vicuna-Bench和MT-Bench中优于基线模型,手动评估也表明我们的模型具有极高的竞争力。通过与最新LLaMA 2模型进行微调,ReaLM在MT-Bench中获得了6.33的领先分数,超过了其他同等规模的模型,包括LLaMA-2-7B-chat模型。我们的方法还展示了可扩展性和可迁移性,并对训练集数据质量与模型性能之间的相互作用进行了初步探索,为未来的研究奠定了坚实的基础。