深度词汇假说：自然语言中的人格结构识别

Mar, 2022

深度词汇假说：自然语言中的人格结构识别

Deep Lexical Hypothesis: Identifying personality structure in natural language

Andrew Cutler, David M. Condon

TL;DR该论文介绍了一种从语言模型中提取形容词相似性的方法，这种方法可以应用于几十种语言，涵盖上万个项目，在历史文本中进行分析，成本极低。通过该方法，可以更加接近词汇假设的原始（语义）视觉。

Abstract

Recent advances in natural language processing (nlp) have produced general models that can perform complex tasks such as summarizing long passages and translating across languages. Here, we introduce a method to

natural language processing adjective similarities correlational structure lexical hypothesis nlp

发现论文，激发创造

概念语言相似性的研究：比较与评估

本研究旨在将语言学的特性纳入到自然语言处理（NLP）中，通过基于基本概念的表示来定义语言之间的相似性并将其应用于二元分类任务中的低资源语言研究。

May, 2023

通过无监督构建的个性化词汇表定制大型语言模型的人格特质

我们介绍了一种在语言模型中调整个性特质的新方法，通过使用一组无监督构建的个性化词典，调整原始语言模型在解码阶段预测下一个词的概率，从而精细地操纵个性特质，并在不更新参数的情况下轻松集成到其他语言模型中。

Oct, 2023

人类概念结构的行为估计在任务上很稳健，但在大型语言模型中不稳定

本文探讨使用认知心理学方法估计和比较人类和 GPT-3 的概念表征结构，结果表明语义结构的估计在人类之间保持一致，而在 GPT-3 中则取决于所使用的任务。

Apr, 2023

利用自然语言学习个性特征的神经网络

本研究使用神经网络和分布式算法来提取文本的隐藏性信息，研究人员从心理学文献定义的五大人格特征（Big Five）的形容词词典开始，并构造了包含文本语义信息的嵌入，证明了个人写作风格与其人格特征密切相关。

Feb, 2023

利用潜变量模型研究跨语言形容词排序倾向

本研究提出了一种基于语料库的多语言形容词顺序模型，能够在 24 种不同语言中准确排序形容词，并通过此模型提供强有力的证据证明了形容词顺序的普适性、跨语言及层级倾向。

Oct, 2020

用户笔文中心理概念抽取与分类的可靠性分析

社交 NLP 研究社区近期在心理健康分析的计算进展中见证了构建负责任的 AI 模型，以应对语言使用和自我认知之间的复杂相互作用。我们通过注释 LoST 数据集捕捉到 Reddit 用户帖子中表明低自尊的微妙文本线索，并发现 NLP 模型在确定低自尊时更关注三种类型的文本线索：触发词、LoST 指标和后果词。我们的研究结果表明，在 Reddit 帖子中确定低自尊时，需要将 PLMs 的重点从触发词和后果词转移到更全面的解释上，强调 LoST 指标。

Jan, 2024

短文本个性特质识别的语言无关和组合模型

通过深度学习方法和文本的原子特征 —— 字符，建立层次化的句向量表示，应用于推文语料库中，有效识别出作者人格特质，与先前基于浅层学习模型的工作相比，在五个特质和三种语言（英语、西班牙语和意大利语）中表现最优，结果鼓舞人心，揭示了检测复杂人类特质的可能性。

Oct, 2016

自然语言推理模型的行为分析：揭示三个因素对鲁棒性的影响

研究自然语言推理 (NLI) 模型的鲁棒性，特别关注三个因素：不敏感、极性和未见过的词汇。结果发现，所有模型在处理未见过的反义词语上表现都欠佳，并且容易受到单词和标签之间的简单统计相关性的影响。

May, 2018

通过机器学习识别人格风格：从患者言语中识别依恋型和内摄型人格风格

通过自然语言处理和机器学习工具，本研究使用语言特征自动推断患者的人格类型，并验证了基于语言特征的自动分类模型在个性分类中的优越性。

Nov, 2023

自然语言处理和心语言学的桥梁：计算基础的巴斯克语和西班牙语语义相似性和关联数据集

本文介绍了一个基于 NLP 资源的语义相似性数据集，用于填补心理语言学研究中的空白，并通过提供大量受词汇处理中起重要作用的变量控制的名词对的语义相似性的各种量化方式。

Apr, 2023