ControlLM: 为语言模型打造多样化个性

Feb, 2024

ControlLM: 为语言模型打造多样化个性

ControlLM: Crafting Diverse Personalities for Language Models

Yixuan Weng, Shizhu He, Kang Liu, Shengping Liu, Jun Zhao

TL;DR利用 ControlLM 控制自然语言处理模型的个性特征，以满足不同类型任务需求，并通过调整模型行为表现出多样的人格特征，提供了改善推理和问题回答的途径。

Abstract

As language models continue to scale in size and capability, they display an array of emerging behaviors, both beneficial and concerning. This heightens the need to control model behaviors. We hope to be able to control the personality traits of →

language models personality traits controllm behavioral prompts model behavior

发现论文，激发创造

外向还是内向？控制你的大型语言模型的个性

大型语言模型 (Large language models, LLMs) 的个性控制是一个关键研究领域，本研究通过综合调查发现，使用 PISF 策略对 LLMs 进行个性控制是最有效和最稳健的方法，具有高效性、高成功率和高鲁棒性。即使在相反个性提示下，由 PISF 控制的 LLMs 仍然表现出稳定且可靠的个性。

Jun, 2024

大型语言模型中的人格特质

本文探讨了使用心理测量测试来量化和分析大型语言模型输出中的人格特质的可靠性和有效性，并讨论了如何对这些模型进行塑造的潜在应用和伦理影响，特别是关于负责任地使用 LLM。

Jul, 2023

识别和操控语言模型的人格特质

本文研究了语言模型，尤其是 GPT2 和 BERT，如何通过语言生成来表现其所体现的人格特质，以及这些特质是否可以被控制。作者通过提供不同类型的语境可以精准地控制这些模型的表现，最终得出这些模型可以作为识别个性特质和控制人格的强有力的工具。本研究还提供了一份基于” 大五人格模型 “的人品数据集和 Reddit 上的人格数据集。

Dec, 2022

PersonalityChat: 基于事实和特征的个性化对话建模的会话提炼

本文利用大型语言模型（LLM）通过个性化对话生成，基于个人特点和人格特质创建了一个合成对话数据集，从而证明了个性化对话模型和与 PersonaChat 相比的表现优势。

Jan, 2024

大型语言模型作为文化角度的叠加

本文介绍了大语言模型（LLMs）是如何呈现出与不同价值观和个性特质相关的不同视角，认为 LLMs 是一系列具有不同价值观和人格特质的透视。在实验中，研究者使用心理学问卷（PVQ，VSM，IPIP）来研究模型表现的价值观和个性特质如何因不同视角而变化。通过定性和定量实验，研究者证明了 LLMs 在不同情境下表达不同的价值观和人格特质，并且探讨了多种相关的科学问题。

Jul, 2023

AI 人格化：评估语言模型的人格特质

研究表明，大规模语言模型虽然可以输出流畅的文本，但它们也捕捉到人类偏见。本文研究了面向开放式文本生成的几种大规模语言模型的人格特征和训练集，使用问卷设计了人格评估，并用零 - shot 分类器将文本回答分类到可量化的特征中，研究了可以改变这些人格特征的方法。

Apr, 2022

超越协助和无害性：通过人物内文学习从大型语言模型中引发多样行为

大规模语言模型在大量文本语料库上进行训练，这些文本语料库编码了各种个性特质。本文提出了一种新的基于贝叶斯推断的个性提取框架 PICLe，旨在使语言模型的行为与目标个性相一致。通过与基准方法在三个当代语言模型上进行广泛比较，我们证明了 PICLe 的有效性。

May, 2024

修改 LLMs 的人格

该论文介绍了一项创新任务，旨在编辑大语言模型（LLMs）的个性特征。通过调整模型对指定主题的观点相关问题的回答，以反映不同的个性特征。作者构建了一个新的基准数据集 PersonalityEdit 来解决这个任务，并进行了综合实验，揭示了这个任务的潜在挑战和未解决的问题。

Oct, 2023

认知和行为是否一致：探讨大型语言模型的个性

通过对大型语言模型进行人格问卷调查，本研究评估了这些模型在表达人类人格特质方面的可靠性，并通过与人类基准的综合分析，探讨了大型语言模型中认知行为分歧的程度，并提出了基于心理学理论和测量方法的假设。

Feb, 2024

AI 人格

本研究论文探讨了在组织环境中将大型语言模型（LLMs）与人类用户对齐的不断发展的情况，超出了基本对齐的范畴，提出了为语言模型提供 “人格对齐” 的想法。通过原始案例研究，我们展示了为人工智能进行人格微调的必要性，并提出了将人类设计的测试应用于人工智能、工程专门的人工智能人格测试以及塑造适应组织角色的人工智能人格等引人思考的问题。该论文为 AI 人格对齐这一新兴领域的讨论和发展提供了起点，为未来在人与机器协同共存和合作的探索奠定了基础。

Dec, 2023