多模态自然语言处理中语义模糊问题的处理

ACLJun, 2023

多模态自然语言处理中语义模糊问题的处理

Dealing with Semantic Underspecification in Multimodal NLP

Sandro Pezzelle

TL;DR本文探讨了语义欠规范的现象在智能系统处理语言时的影响，并分析了多模态系统和人类掌握这种现象的能力。作者呼吁开发者重视该现象，以提升与人类用户交互的语言技术。

Abstract

Intelligent systems that aim at mastering language as humans do must deal with its semantic underspecification, namely, the possibility for a linguistic signal to convey only part of the information needed for communication to succeed. Consider the usages of the pronoun they, which can

semantic underspecification multimodal systems language technology nlp models human communication

发现论文，激发创造

预训练语言模型是否能检测和理解语义不充分？请问 DUST！

通过研究一组语义未明确的句子，我们发现先进的预训练语言模型能够相对准确地识别这些句子，但正确解释它们对于任何语言模型来说都更加困难。我们的实验证明，在解释语义不明确的句子时，语言模型表现出很少的不确定性，与未明确性的理论解释相矛盾。总体而言，我们的研究揭示了当前模型处理句子语义的局限性，并强调在评估语言模型的语言能力时使用自然数据和沟通场景的重要性。

Feb, 2024

场景描述到描绘任务中的欠规范

为填补目前研究中忽视多模态图像 + 文本系统的隐式性、不确定性和缺陷性的空白，本文提出了一个概念框架，着重考虑生成场景描述的图像的系统。我们概述了有关文本和图像传达意义的不同之处的核心挑战，以及可能由不明确和未规定的因素放大的风险。我们提出和讨论了解决这些挑战的策略，包括生成视觉上模棱两可的图像和生成多样化的图像集。

Oct, 2022

恐怕语言模型未对歧义建模

本论文提出了一个基于语言学家注释的语言歧义数据集，并测试了预训练的语言模型在识别和分离歧义上的表现。结果表明，这是一个极具挑战性的任务，现有的模型正确率仅为 32％，本文挑战学术界重新认识语言歧义在自然语言处理中的重要性。同时，本文还展示了一个多标签自然语言推理模型如何帮助识别由于语言歧义而引起的虚假政治言论。

Apr, 2023

基于语义的句法机器翻译中的情态和否定使用

本文描述了为期八周的约翰霍普金斯大学人类语言技术卓越中心应用语言探索夏令营（SCALE-2009）中语义驱动机器翻译（SIMT）的资源和系统构建工作。作者引入了一种新的模态 / 否定（MN）注释方案，基于该方案和词典生成了两个自动化的 MN 标注器，并将其应用于用于翻译的语法框架中，结果显示基于结构的 MN 标注器的标注精确率高达 86％。最终生成的系统有效地提高了翻译质量。

Feb, 2015

作为语言理解初步的，类型协同、表现力强的表示

此论文研究语义分析中的一个初步形式 ——ULFs，并基于手动注释的语料库来训练精确的 ULF 解析器。作者认为，将 ULFs 导出作为语义分析的起点将能够更准确地解析语言含义，进而构建更准确的语义解析器。

Mar, 2019

使用语言模型的学习界限

本文研究大语言模型在自然语言处理中的局限性，特别是无法学习一些基本语义属性，如语义蕴涵和一致性，以及不能学习超越 Borel 层次结构的概念，这对语言模型的语言理解能力产生了严重限制。

Jun, 2023

信息限制神经语言模型揭示不同脑区对语义、句法和语境的敏感性

该研究使用信息限制的自然语言处理模型研究了神经语言学中与句法和语义处理有关的脑区及其空间组织，并发现左右半球在语义和句法处理方面存在差异且在上下文范围和集成窗口方面敏感性不同。

Feb, 2023

语义不确定性：自然语言生成中不确定性估计的语言不变性

本文提出了一种测量大型语言模型中不确定性的方法，介绍了语义熵的概念，并且证明该方法在问答任务上的准确性优于基线模型。

Feb, 2023

面向网络智能系统的语义增强通信

本文探讨了在新兴的网络化系统中，为了实现远程驱动，如何通过语义学方法实现目的导向的信息交换，证明了基于语义学方法采样和传输策略能够显著降低误差率和执行成本。

Jul, 2020

关于一般语言理解

自然语言处理领域对于意义和测量的问题进行了实证研究，本文勾勒了一种理解模型，用于评估当前模型质量测量方法的适应性，并指出不同语言使用情境类型的特点、语言理解是多方面现象，以及理解指标的选择标志了对基准测试和语言处理伦理的考虑的开端。

Oct, 2023