ControlLM: 为语言模型打造多样化个性
大型语言模型 (Large language models, LLMs) 的个性控制是一个关键研究领域,本研究通过综合调查发现,使用 PISF 策略对 LLMs 进行个性控制是最有效和最稳健的方法,具有高效性、高成功率和高鲁棒性。即使在相反个性提示下,由 PISF 控制的 LLMs 仍然表现出稳定且可靠的个性。
Jun, 2024
本文探讨了使用心理测量测试来量化和分析大型语言模型输出中的人格特质的可靠性和有效性,并讨论了如何对这些模型进行塑造的潜在应用和伦理影响,特别是关于负责任地使用 LLM。
Jul, 2023
本文研究了语言模型,尤其是 GPT2 和 BERT,如何通过语言生成来表现其所体现的人格特质,以及这些特质是否可以被控制。作者通过提供不同类型的语境可以精准地控制这些模型的表现,最终得出这些模型可以作为识别个性特质和控制人格的强有力的工具。本研究还提供了一份基于” 大五人格模型 “的人品数据集和 Reddit 上的人格数据集。
Dec, 2022
本文利用大型语言模型(LLM)通过个性化对话生成,基于个人特点和人格特质创建了一个合成对话数据集,从而证明了个性化对话模型和与 PersonaChat 相比的表现优势。
Jan, 2024
本文介绍了大语言模型(LLMs)是如何呈现出与不同价值观和个性特质相关的不同视角,认为 LLMs 是一系列具有不同价值观和人格特质的透视。在实验中,研究者使用心理学问卷(PVQ,VSM,IPIP)来研究模型表现的价值观和个性特质如何因不同视角而变化。通过定性和定量实验,研究者证明了 LLMs 在不同情境下表达不同的价值观和人格特质,并且探讨了多种相关的科学问题。
Jul, 2023
研究表明,大规模语言模型虽然可以输出流畅的文本,但它们也捕捉到人类偏见。本文研究了面向开放式文本生成的几种大规模语言模型的人格特征和训练集,使用问卷设计了人格评估,并用零 - shot 分类器将文本回答分类到可量化的特征中,研究了可以改变这些人格特征的方法。
Apr, 2022
大规模语言模型在大量文本语料库上进行训练,这些文本语料库编码了各种个性特质。本文提出了一种新的基于贝叶斯推断的个性提取框架 PICLe,旨在使语言模型的行为与目标个性相一致。通过与基准方法在三个当代语言模型上进行广泛比较,我们证明了 PICLe 的有效性。
May, 2024
该论文介绍了一项创新任务,旨在编辑大语言模型(LLMs)的个性特征。通过调整模型对指定主题的观点相关问题的回答,以反映不同的个性特征。作者构建了一个新的基准数据集 PersonalityEdit 来解决这个任务,并进行了综合实验,揭示了这个任务的潜在挑战和未解决的问题。
Oct, 2023
通过对大型语言模型进行人格问卷调查,本研究评估了这些模型在表达人类人格特质方面的可靠性,并通过与人类基准的综合分析,探讨了大型语言模型中认知行为分歧的程度,并提出了基于心理学理论和测量方法的假设。
Feb, 2024
本研究论文探讨了在组织环境中将大型语言模型(LLMs)与人类用户对齐的不断发展的情况,超出了基本对齐的范畴,提出了为语言模型提供 “人格对齐” 的想法。通过原始案例研究,我们展示了为人工智能进行人格微调的必要性,并提出了将人类设计的测试应用于人工智能、工程专门的人工智能人格测试以及塑造适应组织角色的人工智能人格等引人思考的问题。该论文为 AI 人格对齐这一新兴领域的讨论和发展提供了起点,为未来在人与机器协同共存和合作的探索奠定了基础。
Dec, 2023