量化和优化基于人物的角色扮演中的全球忠实度

May, 2024

量化和优化基于人物的角色扮演中的全球忠实度

Quantifying and Optimizing Global Faithfulness in Persona-driven Role-playing

Letian Peng, Jingbo Shang

TL;DR该研究提出了一种量化 PRP 忠实度的创新方法，通过从 Active-Passive-Constraint（APC）得分入手，将所有约束合并成一种解释性评估标准。同时，在实验中验证了此评分系统的质量，并将其用于直接偏好优化（DPO）中，以获得更好的 AI 角色。结果发现，APC-DPO 是一种精确均衡所有约束的竞争性技术，可以与其他技术结合使用。

Abstract

persona-driven role-playing (prp) aims to build AI characters that can respond to user queries by faithfully sticking with all persona statements. Unfortunately, existing →

persona-driven role-playing faithfulness prp constraint-wise sum direct preference optimization

发现论文，激发创造

通过角色扩展来提高对话中的人格一致性

该论文提出了一种新的检索到预测范例来解决个性化聊天机器人中 OOP 问题，并通过采用实际人物进行后验转换来进一步缓解训练和推理之间的差距。并通过 IT-ConvAI2 和 ConvAI2 的广泛实验表明，我们提出的模型在自动指标和人类评估方面都取得了可观的改进。

Aug, 2022

从角色扮演到个性化：关于语言代理的调查

通过大型语言模型与角色扮演语言代理的结合，该研究对 RPLAs 进行了综合调查，介绍了其发展和最新进展，并将其应用于 AI 应用中，以实现个性化服务。

Apr, 2024

捕捉思维，而非语言：使用个性指示数据增强角色扮演语言模型

我们通过应用特征性数据提升小型角色扮演语言模型，实验证明使用我们的数据集训练的模型在一般和与个性相关的评估中展现了高级角色扮演能力。

Jun, 2024

通过重建虚构人物的角色形象增强一致性和专业知识的捕获

通过引入 CharacterGPT 框架并利用文档语言模型，我们提出了一种解决助手 API 在维持人物一致性方面面临的挑战的新方法，通过从小说摘要中提取人物特征来更新人物形象，实现了稳定的人物一致性，并在角色扮演代理研究中创造了新的可能性。

May, 2024

我会听起来像我自己吗？通过实践自我意识提高对话中的人物形象一致性

我们探讨了如何通过 Rational Speech Acts 框架的方法，为已有的对话代理赋予公共自我意识的能力，以强化其一致性并减少矛盾，同时探索了如何在对话中提高背景一致性。

Apr, 2020

提高回复和角色真实事实之间的事实一致性

通过增加奖励机制，使用强化学习方法来提高响应与用户角色特征事实之间的一致性，从而促进神经模型的响应生成能力。

Apr, 2020

利用自然语言推理生成人物一致的对话

利用自然语言推断技术探讨生成持续一致人格的对话，提出基于强化学习框架使用从响应 - 人格对得到的自然语言推断信号作为奖励来生成至关一致的对话，并通过对话者的关注机制编码器 - 解码器来生成基于人格的响应，使用对抗训练的自然度模块和基于自然语言推断的一致性模块来评估生成的响应的一致性，实验表明该方法优于强大的生成基线，特别是在生成响应的人格一致性方面。

Nov, 2019

反思性语言编程（RLP）：社会感知型人工通用智能（SocialAGI）中的垫脚石

本文提出了一种名为反思性语言编程（RLP）的独特方法，它强调自我意识和战略规划，鼓励模型在自身的预定义人格特征、对传入消息的情感反应和计划策略上进行内省，实现情境丰富、连贯、有吸引力的交互。RLP 在社交性 AGI 领域的应用潜力巨大，从微妙的谈判和精神健康支持系统到创建多样化和动态的 AI 角色。通过欺骗的探索，我们迈向了 AGI 的一个新前沿，一个充满先进认知建模和真正的人类数字灵魂创造机会的时代。

May, 2023

利用离线强化学习构建具有一致性个性的对话代理

通过使用离线强化学习框架提高对话系统的人物一致性，结合监督学习的现有数据训练和奖惩特定话语，引入简化的重要性采样方法，可以改善社交聊天机器人的人物一致性和对话质量。

Oct, 2023

借助大语言模型生成忠实的以人为基础的对话数据集

通过建立 Generator-Critic 架构，使用 LLM 生成会话，借助 Synthetic-Persona-Chat 评估了高质量对话数据集对 NLP 模型的影响。

Dec, 2023