PersonalityChat: 基于事实和特征的个性化对话建模的会话提炼
通过建立 Generator-Critic 架构,使用 LLM 生成会话,借助 Synthetic-Persona-Chat 评估了高质量对话数据集对 NLP 模型的影响。
Dec, 2023
本文探讨了使用心理测量测试来量化和分析大型语言模型输出中的人格特质的可靠性和有效性,并讨论了如何对这些模型进行塑造的潜在应用和伦理影响,特别是关于负责任地使用 LLM。
Jul, 2023
大语言模型为生成会话代理带来了重大进展,使得在各种话题上实现无缝、情境相关的对话成为可能。然而,现有的以语言模型为驱动的对话代理拥有固定的个性和功能,限制了它们适应个人用户需求的能力。通过创建具有特定专长或特点的个性化代理人物,可以解决这个问题。尽管如此,我们对人们如何定制和与代理人物互动缺乏了解。在这项研究中,我们调查了用户如何定制代理人物以及其对互动质量、多样性和动力的影响。为此,我们开发了 CloChat,这是一个支持在大语言模型中轻松准确地定制代理人物的接口。我们进行了一项研究,比较了参与者如何与 CloChat 和 ChatGPT 互动。结果表明,参与者与定制代理人物建立了情感纽带,进行了更加动态的对话,并表现出对维持互动的兴趣。这些发现为未来使用大语言模型的对话代理系统的设计提供了启示。
Feb, 2024
本研究旨在研究将个性特征应用于对话生成中以提供个性化对话的问题,并提出了一种基于关键 - 值对的嵌入式特征融合模块和两种新颖的特征感知机制,即基于对话者的关注机制和基于对话者的偏置机制,并构建了 PersonalDialog 数据集,该数据集包含来自海量讲话者的具有不同特征的大量多轮对话。实验结果表明,所提出的模型能够在不同情境下处理适当的特征。
Jan, 2019
本研究探讨了大型语言模型(LLMs)从自由交互中推断五大人格特质的能力。结果表明,由 GPT-4 驱动的聊天机器人可以以适度的准确性推断人格,优于从静态文本内容中推断的先前方法。推断的准确性在不同的对话环境下有所变化。当聊天机器人被要求引出与个性相关的信息时,性能最高(平均 r=.443,范围 =[.245, .640]),其次是强调自然互动的条件(平均 r=.218,范围 =[.066, .373])。值得注意的是,在直接关注个性评估的条件下,用户体验并未降低,参与者报告两种条件下的交互同样自然、愉快、吸引人和类似人类。一个模仿 ChatGPT 作为有益助手的聊天机器人导致较差的个性推断准确性和较低的用户体验评级,但仍然捕捉到一些人格特质的心理学意义信息(平均 r=.117,范围 =[-.004, .209])。初步分析表明,个性推断的准确性在不同的社会人口子群中只有轻微的差别。我们的结果突出了 LLMs 在基于对话交互的心理剖析中的潜力。我们讨论了与这些发现相关的实际意义和伦理挑战。
May, 2024
通过引入 1.33 亿真实的中文对话数据集 LiveChat,并提出基于先进技术的检索式基线方法,本研究在多方对话范围内针对回应建模和宾语识别等两个关键任务进行研究,并验证了利用人物特征和更大的平均会话数对任务的积极影响,同时还提出了当前挑战的未来方向。
Jun, 2023
我们在 GPT-3.5 上通过提示方式进行个性化训练,创建了一组双组群体的 LLM 代理,然后进行个性测试并将代理提交到协作写作任务中,发现不同个性表现出不同程度的人格一致性和语言对话伙伴的语言协调性。我们的研究旨在为更好地理解 LLMs 之间基于对话的交互奠定基础,并强调了在交互环境中塑造稳健且更具人性的 LLM 个性的新方法的需求。
Feb, 2024
本文研究借助简单描述包含社会人口和个性类型信息,大型语言模型(LLMs)在重建人类认知中基本性格特征方面的能力。通过利用 HEXACO 人格框架,我们的研究探讨了 LLMs 在从简单描述中恢复和预测潜在人格维度的一致性。实验证明在人格重建方面存在显著的一致性,但也观察到一些不一致性和偏见,例如在缺乏明确信息时默认为积极特质。此外,年龄和子女数量等社会人口因素也会影响恢复的人格维度。这些发现对于利用 LLMs 构建复杂的基于代理的模拟具有重要意义,并强调了对 LLMs 中健壮人格生成的进一步研究的需求。
Jun, 2024
借助不同输入提示,使用多个参数大小的多个大型语言模型对它们的输出进行了评估,结果显示,大型语言模型普遍表现出高度的开放性和低度的外向性,且参数越多越倾向于开放性和责任心,并且在不同数据集上对细调模型产生了微小的调整
Feb, 2024
大型语言模型(LLMs)能够理解人类指令并生成高质量的文本,使它们能够模拟人类行为并超越简单的复制。本研究介绍了可定制的对话代理框架,利用 LLMs 模拟真实世界中可以根据用户偏好自由定制的角色。提出了 SimsConv 数据集和 SimsChat 对话代理,模拟不同情景下角色的生活经历和特定情感的专题交互。实验证明该框架取得了令人满意的性能,并为未来构建更好的人类模拟提供了有益的指导。
Jun, 2024