Jul, 2024

自我启动调整:使LLM自主扮演角色

TL;DR近期LLMs的研究显示出其引人注目的角色扮演能力,能够根据不同的指令和环境准确模拟各种角色的对话风格和认知过程。本文通过自主调优的方式,使LLMs自动生成专家角色提示,从而自动化复杂的提示策略。使用LIMA数据集作为基础语料库,通过GPT-4为每个数据点注释角色提示,创建了LIMA-Role数据集,并在LIMA-Role上对LLMs进行微调,进一步证明了自主调优的LLMs在大多数数据集上优于标准指令调优的基准模型。