使用预训练语言模型进行 Myers-Briggs 人格分类和个性化语言生成
本文讨论了自然语言处理中预训练语言模型在个性化分类方面的应用,并使用 BERT 模型在 MBTI 人格模型上进行了实验,发现该方法在多个评估场景下显著优于基于词袋和静态词嵌入的文本分类模型,并且通常优于前人在该领域的工作。
Jul, 2022
本研究运用朴素贝叶斯、支持向量机和循环神经网络等机器学习技术,基于 Myers-Briggs 类型指标(MBTI)的文本预测人格,并应用 CRISP-DM 和敏捷方法来指导学习过程。
Jan, 2022
我们提出了一种将 Myers-Briggs Type Indicator (MBTI) 个性特征整合到大型语言模型 (LLMs) 中的新方法,解决了个性一致性在个性化人工智能中的挑战。我们的方法,称为 “Machine Mindset”,通过两阶段的微调和直接偏好优化 (DPO) 将 MBTI 特征嵌入 LLMs 中。这种方法确保模型内化这些特征,提供了稳定和一致的个性配置文件。我们通过在不同领域展示模型表现与其对应的 MBTI 特征之间的对齐,证明了我们模型的有效性。该论文在个性数据集的开发和个性整合在 LLMs 的新训练方法方面做出了重大贡献,增强了个性化人工智能应用的潜力。我们还在 https://github.com/PKU-YuanGroup/Machine-Mindset 上开源了我们的模型和部分数据。
Dec, 2023
本文旨在探究利用人格评估工具 MBTI 对大型语言模型进行评估的可行性,并通过广泛实验探索不同模型的人格类型、通过提示工程改变人格类型的可能性以及训练数据集对模型人格的影响。尽管 MBTI 不是一个严谨的评估工具,但它仍然能够反映 LLMs 与人类人格之间的相似程度,并有潜力作为一个粗略的指标。
Jul, 2023
本文旨在确定最有效的机器学习模型,以准确地从 Reddit 帖子和 Kaggle 数据集中对 Myers-Briggs 类型指标(MBTI)进行分类。我们应用多标签分类和二元关联方法,并使用可解释的人工智能(XAI)方法突出流程和结果的透明度和可理解性。为了实现这一目标,我们试验了针对简单性、透明度和可解释性而设计的玻璃盒学习模型。我们选取了 k-Nearest Neighbour、Multinomial Naive Bayes 和 Logistic Regression 作为玻璃盒模型。我们表明,如果排除观察者(S)特质类别,Multinomial Naive Bayes 和 k-Nearest Neighbour 表现更好,而当所有类别都有超过 550 条记录时,Logistic Regression 获得最佳结果。
May, 2024
提出了 Story2Personality 数据集,该数据集主要用于预测电影角色的人格特质。实验证明,使用多视角模型可以比仅使用语言描述获得更高的人格预测准确率。
Oct, 2022
本文介绍基于语言使用进行人格预测的交叉性研究,报道了用于文本数据的最全面的心理语言学特征和混合模型的两个主要改进,实验结果表明,这些模型优于同一数据集上的现有工作,并通过对心理语言学特征的不同类别进行消融实验来量化其影响。
Apr, 2022
自动检测个性特征的研究方法已引起计算语言学领域的广泛关注,本文针对此领域中数据集有限的问题,收集和发布了一个包含 1.52 亿推文和 5.6 万份数据点的研究社区最大的自动整理数据集,以用于预测迈尔斯 - 布里格斯(MBTI)人格类型,通过对数据进行定性和定量研究,分析了数据的模式,并得出了相应的结论。
Sep, 2023
该研究探索了 AI 性格或 AInality 的概念,表明大型语言模型(LLMs)呈现出与人类个性类似的模式。通过使用人类中心的心理测量测试,如迈尔斯 - 布里格斯类型指标(MBTI)、大五人格测试(BFI)和短暗黑三博士(SD3),我们确认了 LLM 的个性类型,并通过引入角色扮演提示,展示了 LLMs 的适应性,显示了它们在不同个性类型之间动态切换的能力。使用项目性测试,如华盛顿大学句子完成测试(WUSCT),我们揭示了 LLMs 个性的隐藏方面,这些方面通过直接提问很难获取。项目测试允许对 LLMs 的认知过程和思维模式进行深入探索,并为 AInality 提供了多方面的视角。我们的机器学习分析发现,LLMs 表现出明显的 AInality 特征和多样化的个性类型,展示了对外部指令的动态变化。该研究开创了在 LLMs 上应用项目性测试的先例,揭示了它们多样而适应性的 AInality 特征。
Dec, 2023
本研究通过构建新的基于《生活大爆炸》电视节目的数据集,并引入 MBTI 个性化能力,提出了一种新的人本多模态推理 (Personality-aware HMR) 任务及相应的基准方法,并在此基础上进一步提出了一项人格预测多模态推理 (Personality-predicted HMR) 任务及其对应的方法,实验证明个性化信息能够有效提高人本多模态推理的性能。
Apr, 2023