LLM 对于捕捉结构化语义的潜力与限制：以 SRL 为例的案例研究

May, 2024

LLM 对于捕捉结构化语义的潜力与限制：以 SRL 为例的案例研究

Potential and Limitations of LLMs in Capturing Structured Semantics: A Case Study on SRL

Ning Cheng, Zhaohui Yan, Ziming Wang, Zhijie Li, Jiaming Yu...

TL;DR利用语义角色标注 (SRL) 作为基本任务评估了大型语言模型 (LLM) 理解和提取结构化语义的能力。我们提出了 PromptSRL，这是一个少样本 SRL 解析器，可以让 LLM 将自然语言映射到显式的语义结构，从而揭示 LLM 的属性。结果发现，LLM 确实能够捕捉语义结构，扩大模型规模并不总是表现出更好的潜力。此外，我们观察到 LLM 在 C-arguments 等方面存在局限性。最后，令人惊讶的是，在 30% 的错误中，LLM 和未经训练的人类犯了很多重叠的错误。

Abstract

large language models (LLMs) play a crucial role in capturing structured semantics to enhance language understanding, improve interpretability, and reduce bias. Nevertheless, an ongoing controversy exists over the extent to which LLMs can grasp →

large language models semantic role labeling structured semantics few-shot srl parser llms limitations

发现论文，激发创造

通过问答探究语言模型对结构化语义理解和生成的能力

最近大规模语言模型能力的进步引发了对其评估的新浪潮，这篇研究工作通过在自然语言和形式语言之间的相互转换来验证大规模语言模型理解和生成结构化逻辑形式的能力，实验证明现今最先进的大规模语言模型在理解逻辑形式方面整体上接近人类水平，但在生成正确逻辑形式方面仍有改进的空间，使用大规模语言模型生成更自然的语言训练数据以增强小型模型的效果更好，同时结果还表明模型对不同形式语言表现出显著的敏感性，总体而言，形式化程度较低、更接近自然语言的形式语言对大规模语言模型更友好。

Jan, 2024

使用语言模型的学习界限

本文研究大语言模型在自然语言处理中的局限性，特别是无法学习一些基本语义属性，如语义蕴涵和一致性，以及不能学习超越 Borel 层次结构的概念，这对语言模型的语言理解能力产生了严重限制。

Jun, 2023

面向语法的多语言语义角色标注

本研究关注于多语言语义角色标注（SRL）模型的开发，并围绕句法规则、上下文化词表示等因素展开了研究，提出了一种基于句法规则的剪枝方法，并在 CoNLL-2009 的七种语言基准测试中实现了状态 - of-the-art 的效果，并验证了深度增强表示对多语言 SRL 的有效性。

Sep, 2019

有监督的知识提升大语言模型在上下文学习中的表现

通过提示工程，大型语言模型（LLMs）展示了在上下文学习中的新兴能力。最近在大规模生成模型方面的进展进一步扩展了它们在实际语言应用中的使用。然而，在自然语言理解和问题回答方面，提高 LLMs 的泛化能力和准确性的关键挑战仍未得到充分探索。

Dec, 2023

语义角色标注的结构调整

本文提出了一种结构调整框架，以在训练时通过软化约束来提高模型性能，利用神经网络的表达能力和具有结构化损失的监督学习组件，通过实验证明可以在语义角色标注任务中取得比 RoBERTa 等基线更好的结果，并在低资源情况下实现了持续改进。

May, 2020

由学徒到研究助理：大型语言模型推动研究

通过文献综述和第一手实验，本文研究了大型语言模型（LLMs）的潜力。尽管 LLMs 具有成本效益和高效性等优点，但也存在着诸如提示调优、偏见和主观性等挑战。该研究通过利用 LLMs 进行定性分析的实验提供了新的见解，强调了成功和限制。此外，本文还讨论了缓解挑战的策略，如优化提示技术和利用人类专业知识。我们的工作旨在将 LLMs 有机地融入人机交互数据工作，并积极促进其负责任的应用，以此回应关于 LLMs 在研究中负责任应用的持续对话。

Apr, 2024

中文语义角色标注的句法感知多任务学习框架

本文介绍了基于统一覆盖模型的跨度和基于单词的语义角色标注，并提出了一种多任务学习框架，其中包括基本 SRL 模块和依赖性解析器模块，通过该框架，我们使用外部句法表示得到了新的最先进的中文 SRL 良好结果。

Nov, 2019

大型语言模型：当前辩论的细腻需求和实用角度下的理解

当前大型语言模型（LLMs）在生成符合语法、流畅的文本方面无与伦比。这篇论文针对 LLMs 的能力进行了辩论，并通过批判性评估三个经常在批评中出现的观点来展示 LLMs 仍需更多细化。其次，文章从实证和理论的角度提出了对 LLMs 中 “真正” 的理解和意向性的实用观点，并讨论了在何种情况下将心理状态归因于 LLMs 对于这一日益重要的技术在社会中具有实用的哲学背景。

Oct, 2023

LLM 是否能够有效利用结构信息进行图学习：何时以及为什么

该研究探讨了大型语言模型（LLMs）在结构化数据（尤其是图形）上的应用，旨在理解何时以及为何将图形数据中固有的结构信息纳入到 LLMs 的节点分类任务中可以提高预测性能。

Sep, 2023

语法感知的神经语义角色标注

本文探讨是否在神经网络中使用额外的句法特征表示对语义角色标注（SRL）有益，实验结果表明这有助于提高 SRL 的性能，并且在 CoNLL-2005 数据集上达到了新的最先进水平。

Jul, 2019