Oct, 2023

BotChat: 评估 LLMs 在进行多轮对话方面的能力

TL;DR利用 GPT-4 对人类风格的多轮对话进行评估,发现大语言模型在生成多轮对话方面具有出色的质量,明显优于其他模型。