May, 2024

LLM 对于捕捉结构化语义的潜力与限制:以 SRL 为例的案例研究

TL;DR利用语义角色标注 (SRL) 作为基本任务评估了大型语言模型 (LLM) 理解和提取结构化语义的能力。我们提出了 PromptSRL,这是一个少样本 SRL 解析器,可以让 LLM 将自然语言映射到显式的语义结构,从而揭示 LLM 的属性。结果发现,LLM 确实能够捕捉语义结构,扩大模型规模并不总是表现出更好的潜力。此外,我们观察到 LLM 在 C-arguments 等方面存在局限性。最后,令人惊讶的是,在 30% 的错误中,LLM 和未经训练的人类犯了很多重叠的错误。