GPT-3 对新的英语名词复合词的解释的系统性

EMNLPOct, 2022

GPT-3 对新的英语名词复合词的解释的系统性

Systematicity in GPT-3's Interpretation of Novel English Noun Compounds

Siyan Li, Riley Carlson, Christopher Potts

TL;DR研究 GPT-3 对英语名词复合词的解释是否遵循同样的概念原则，通过实验和构建提示，没有找到令人信服的证据来证明 GPT-3 的解释不仅限于单个词汇项目。

Abstract

Levin et al. (2019) show experimentally that the interpretations of novel english noun compounds (e.g., stew skillet), while not fully compositional, are highly predictable based on whether the modifier and head refer to artifacts or natural kinds. Is the large language model

english noun compounds conceptual reasoning distributional regularities gpt-3 lexical items

发现论文，激发创造

从巧克力兔到巧克力鳄鱼：语言模型是否理解名词复合词？

这篇论文提出了一种修改后的核心任务和评估方法，用于解决名词组解释和概念化的问题，并表明 GPT-3 在这两个任务上的表现都很出色，尤其是后者，因为它需要创造力、常识和知识的广泛推广能力。此外，研究人员估计了 GPT-3 处理新名词组的能力，并探讨了 GPT-3 的推理能力是否在与无脑地执行训练数据的策略之间取得平衡。

May, 2023

使用 GPT-3 生成的对象概念的语义特征

通过探究 GPT-3 生成的语义特征，以及这些特征与通过人工选择实验得出的特征列表之间的共同点，此项研究证实了使用大型语言模型自动生成可解释特征集的潜力，并且扩大了各种心理和语言研究中语义特征的使用范围。

Feb, 2022

GPT-3 对文章 + 形容词 + 数字 + 名词结构进行审慎的几千次判定

研究使用 GPT-3 对英语 Article + Adjective + Numeral + Noun 结构进行自然度判断，结果与人类自然度判断基本一致，但有时与文献及人类自然度判断存在差异。

Jan, 2023

运用认知心理学理解 GPT-3

本文借助认知心理学的工具对最近的大型语言模型 GPT-3 进行了研究评估其在任务决策、信息搜索、思考以及因果推理方面的能力，结果显示 GPT-3 表现出的许多行为令人印象深刻，能够像人类一样解决任务，但也发现了其局限性，如对于因果推理任务失败，这些结果丰富了我们对当前大型语言模型的理解，并为进一步利用认知心理学工具研究越来越能干和难以理解的人工智能代理铺平了道路。

Jun, 2022

大型语言模型中的紧急类比推理

本研究探讨了大型语言模型（比如 GPT-3）在模拟人类的模拟推理能力方面的表现，特别是它在没有直接训练的情况下是否能够进行零样本推理。研究发现，GPT-3 在抽象模式归纳方面具有出色的能力，并能够在大多数场景中匹配或超过人类的能力。因此，大型语言模型能够在许多类比问题中找到零样本解决方案。

Dec, 2022

在 GPT-3 和 GPT-4 中测试词义的因果模型

本研究通过 HIPE 理论评估了 GPT-3 和 GPT-4 的词汇表示，结果发现 GPT-3 未编码所假设的因果结构，但发现 GPT-4 编码了这种结构，为评估大型语言模型的表征能力做出了贡献。

May, 2023

在测试语言不常见方面的人工智能性能时，暴露对底层意义的不敏感性

本研究探讨基于计算方法和大数据的人工智能应用中所使用的大型语言模型的语言表现，着重考察语言表现是否由语言知识所导引。结果发现即便是常规语法结构之外的、不太常见的语言结构也可能导致大型语言模型表现出不足的语言能力，暗示这种类型的语言模型实际上并不像人类一样具有对语言的深入理解。

Feb, 2023

设计统计语言学习器：关于名词复合词的实验

该论文通过提出一种新型设计实现语言分析，包括统计语言学习的理论贡献，将概率赋给语义形式而不是更表面的语言元素，以及通过实验证明在名词组分析方面，提出的句法模型明显优于先前提出的模型，语义模型第一次以统计方法解决该问题，显示出更高的准确性，为未来研究提出了广泛适用的数据需求理论。

Sep, 1996

大型语言模型展示对新颖文学隐喻的演绎能力

通过评估 GPT-4，一个尖端的大型语言模型，在解释塞尔维亚诗歌中提取的新颖文学隐喻时所提供的自然语言解释能力，它未展现出之前接触过这些隐喻的迹象，但提供了详细而深刻的解释，被盲审的人员（不知道涉及 AI 模型的事实）将 GPT-4 生成的隐喻解释评为优于来自一组大学生的解释，这些结果表明 GPT-4 等大语言模型已经获得了解释复杂新颖隐喻的新兴能力。

Aug, 2023

使用深度网络在大脑中区分语法和语义

通过对 GPT-2 的激活进行统计的方法，将语言模型的高维度激活分解成四个组合类别：词汇、组合、句法和语义表示，并发现组合表示比词汇表示更广泛地招募了大脑皮层网络，并且句法和语义共享一个分布式神经基础。该研究提出了一个多功能的框架来分离神经活动中的语言建构分布式表示。

Mar, 2021