本研究旨在将语言学的特性纳入到自然语言处理(NLP)中,通过基于基本概念的表示来定义语言之间的相似性并将其应用于二元分类任务中的低资源语言研究。
May, 2023
我们介绍了一种在语言模型中调整个性特质的新方法,通过使用一组无监督构建的个性化词典,调整原始语言模型在解码阶段预测下一个词的概率,从而精细地操纵个性特质,并在不更新参数的情况下轻松集成到其他语言模型中。
Oct, 2023
本文探讨使用认知心理学方法估计和比较人类和 GPT-3 的概念表征结构,结果表明语义结构的估计在人类之间保持一致,而在 GPT-3 中则取决于所使用的任务。
Apr, 2023
本研究使用神经网络和分布式算法来提取文本的隐藏性信息,研究人员从心理学文献定义的五大人格特征(Big Five)的形容词词典开始,并构造了包含文本语义信息的嵌入,证明了个人写作风格与其人格特征密切相关。
Feb, 2023
本研究提出了一种基于语料库的多语言形容词顺序模型,能够在 24 种不同语言中准确排序形容词,并通过此模型提供强有力的证据证明了形容词顺序的普适性、跨语言及层级倾向。
Oct, 2020
社交 NLP 研究社区近期在心理健康分析的计算进展中见证了构建负责任的 AI 模型,以应对语言使用和自我认知之间的复杂相互作用。我们通过注释 LoST 数据集捕捉到 Reddit 用户帖子中表明低自尊的微妙文本线索,并发现 NLP 模型在确定低自尊时更关注三种类型的文本线索:触发词、LoST 指标和后果词。我们的研究结果表明,在 Reddit 帖子中确定低自尊时,需要将 PLMs 的重点从触发词和后果词转移到更全面的解释上,强调 LoST 指标。
Jan, 2024
通过深度学习方法和文本的原子特征 —— 字符,建立层次化的句向量表示,应用于推文语料库中,有效识别出作者人格特质,与先前基于浅层学习模型的工作相比,在五个特质和三种语言(英语、西班牙语和意大利语)中表现最优,结果鼓舞人心,揭示了检测复杂人类特质的可能性。
Oct, 2016
研究自然语言推理 (NLI) 模型的鲁棒性,特别关注三个因素:不敏感、极性和未见过的词汇。结果发现,所有模型在处理未见过的反义词语上表现都欠佳,并且容易受到单词和标签之间的简单统计相关性的影响。
May, 2018
通过自然语言处理和机器学习工具,本研究使用语言特征自动推断患者的人格类型,并验证了基于语言特征的自动分类模型在个性分类中的优越性。
Nov, 2023
本文介绍了一个基于 NLP 资源的语义相似性数据集,用于填补心理语言学研究中的空白,并通过提供大量受词汇处理中起重要作用的变量控制的名词对的语义相似性的各种量化方式。