自我启动调整：使LLM自主扮演角色

Jul, 2024

自我启动调整：使LLM自主扮演角色

Self-Prompt Tuning: Enable Autonomous Role-Playing in LLMs

Aobo Kong, Shiwan Zhao, Hao Chen, Qicheng Li, Yong Qin...

TL;DR近期LLMs的研究显示出其引人注目的角色扮演能力，能够根据不同的指令和环境准确模拟各种角色的对话风格和认知过程。本文通过自主调优的方式，使LLMs自动生成专家角色提示，从而自动化复杂的提示策略。使用LIMA数据集作为基础语料库，通过GPT-4为每个数据点注释角色提示，创建了LIMA-Role数据集，并在LIMA-Role上对LLMs进行微调，进一步证明了自主调优的LLMs在大多数数据集上优于标准指令调优的基准模型。

Abstract

Recent advancements in llms have showcased their remarkable role-playing capabilities, able to accurately simulate the dialogue styles and cognitive processes of various roles based on different instructions and contexts. Studies indicate that assigning →

发现论文，激发创造

角色扮演引导的零样本推理的改进

通过角色扮演提示方法，在各种推理基准测试中展示了大型语言模型 (LLMs) 的推理能力的提升。

Aug, 2023

RoleLLM：大型语言模型角色扮演能力的基准、激发和增强

RoleLLM是一种框架，用于在大规模语言模型中评估和增强角色扮演能力。通过Context-Instruct和RoleGPT，我们创建了RoleBench，这是角色扮演的第一个系统性和细致的基于角色的基准数据集，该数据集包含168,093个样本。此外，通过RoleBench上的RoCIT，我们获得了RoleLLaMA（英文）和RoleGLM（中文），显著增强了角色扮演的能力，甚至与使用GPT-4的RoleGPT的结果相当。

Oct, 2023

通过自我对话增强基于LLM的任务导向对话系统

通过使用大型语言模型进行自我对话的方法可以改进对话质量并生成用于训练的自我对话数据集。

Jan, 2024

大规模语言模型是所有字符的叠加：通过自我对齐实现任意角色扮演

本研究通过利用大规模训练语料库中角色知识，提出了一种自对齐的角色扮演方法 Ditto，其将一个在读解问题上进行指令遵循的大型语言模型调整为模拟角色扮演对话。通过使用自动生成的角色扮演训练数据集对模型进行微调，Ditto展现出在多轮对话中一致的角色身份和准确的角色特定知识，性能高于其他开源角色扮演基准，并与先进的专有聊天机器人相媲美。与此同时，研究还展示了大型语言模型自身的内在能力限制了角色特定知识的获取，但通过辅助较小模型的指导可以轻松获得角色扮演风格。

Jan, 2024

通过积极查询提升角色扮演系统: 评估与改进

通过设计MORTISE来改进角色扮演LLMs的性能，我们构建了具有高度角色相关性的攻击性查询，通过多个基于LLM的模块协同努力生成相应的回复，并形成对抗性训练数据集RoleAD。结果表明，现有模型在角色对齐能力上存在普遍不足，而经过RoleAD改进的模型在改善这一不足方面表现出了一定的泛化性。

Feb, 2024

LLM聊天机器人的模仿能力如何？通过ECHO评估

使用 ECHO 框架基于图灵测试评估三种角色扮演型大型语言模型（LLMs），结果发现 GPT-4 在欺骗人类评估者方面更为有效，并且 GPTs 实现了48.3%的领先成功率。

Apr, 2024

角色扮演的模版框架：生成与评估

使用大型语言模型（LLM）构建角色扮演对话数据集并评估性能的框架，并使用召回导向的Rouge-L指标支持LLM评估器的结果。

Jun, 2024

人格是把双刃剑：通过结合角色扮演和中性提示增强零-shot推理

本研究解决了角色扮演人格在大规模语言模型（LLM）中引发的推理能力下降的问题。提出了Jekyll Hyde框架，通过集成角色扮演与中性提示的结果来提升推理能力，并针对现有的LLM评估器的顺序偏差进行了优化。实验结果表明，该方法显著提升了LLM在多个推理数据集上的表现。

Aug, 2024

自我指导派生提示生成与上下文学习的结合：释放黑箱LLMs的新潜力

本研究解决了黑箱大型语言模型（LLMs）在响应质量提升中的局限，提出了一种自我指导的上下文学习框架，通过生成可靠的派生提示来构建信息丰富的上下文环境。实验表明，该方法不仅生成更可靠的提示，还显著提升了LLMs（包括GPT-4）的响应效果。

Sep, 2024

角色扮演推理中的偏见与毒性

本研究解决了角色扮演在大型语言模型中可能引发的偏见和有害输出的问题。通过系统评估角色扮演对模型在不同基准测试中的影响，研究发现尽管模型的推理能力有所提升，但角色扮演的应用往往增加了生成刻板印象和有害内容的可能性。这一发现对未来的语言模型设计和应用具有重要影响。

Sep, 2024