多模态自然语言处理中语义模糊问题的处理
通过研究一组语义未明确的句子,我们发现先进的预训练语言模型能够相对准确地识别这些句子,但正确解释它们对于任何语言模型来说都更加困难。我们的实验证明,在解释语义不明确的句子时,语言模型表现出很少的不确定性,与未明确性的理论解释相矛盾。总体而言,我们的研究揭示了当前模型处理句子语义的局限性,并强调在评估语言模型的语言能力时使用自然数据和沟通场景的重要性。
Feb, 2024
为填补目前研究中忽视多模态图像 + 文本系统的隐式性、不确定性和缺陷性的空白,本文提出了一个概念框架,着重考虑生成场景描述的图像的系统。我们概述了有关文本和图像传达意义的不同之处的核心挑战,以及可能由不明确和未规定的因素放大的风险。我们提出和讨论了解决这些挑战的策略,包括生成视觉上模棱两可的图像和生成多样化的图像集。
Oct, 2022
本论文提出了一个基于语言学家注释的语言歧义数据集,并测试了预训练的语言模型在识别和分离歧义上的表现。结果表明,这是一个极具挑战性的任务,现有的模型正确率仅为 32%,本文挑战学术界重新认识语言歧义在自然语言处理中的重要性。同时,本文还展示了一个多标签自然语言推理模型如何帮助识别由于语言歧义而引起的虚假政治言论。
Apr, 2023
本文描述了为期八周的约翰霍普金斯大学人类语言技术卓越中心应用语言探索夏令营(SCALE-2009)中语义驱动机器翻译(SIMT)的资源和系统构建工作。作者引入了一种新的模态 / 否定(MN)注释方案,基于该方案和词典生成了两个自动化的 MN 标注器,并将其应用于用于翻译的语法框架中,结果显示基于结构的 MN 标注器的标注精确率高达 86%。最终生成的系统有效地提高了翻译质量。
Feb, 2015
此论文研究语义分析中的一个初步形式 ——ULFs,并基于手动注释的语料库来训练精确的 ULF 解析器。作者认为,将 ULFs 导出作为语义分析的起点将能够更准确地解析语言含义,进而构建更准确的语义解析器。
Mar, 2019
本文研究大语言模型在自然语言处理中的局限性,特别是无法学习一些基本语义属性,如语义蕴涵和一致性,以及不能学习超越 Borel 层次结构的概念,这对语言模型的语言理解能力产生了严重限制。
Jun, 2023
该研究使用信息限制的自然语言处理模型研究了神经语言学中与句法和语义处理有关的脑区及其空间组织,并发现左右半球在语义和句法处理方面存在差异且在上下文范围和集成窗口方面敏感性不同。
Feb, 2023
本文探讨了在新兴的网络化系统中,为了实现远程驱动,如何通过语义学方法实现目的导向的信息交换,证明了基于语义学方法采样和传输策略能够显著降低误差率和执行成本。
Jul, 2020
自然语言处理领域对于意义和测量的问题进行了实证研究,本文勾勒了一种理解模型,用于评估当前模型质量测量方法的适应性,并指出不同语言使用情境类型的特点、语言理解是多方面现象,以及理解指标的选择标志了对基准测试和语言处理伦理的考虑的开端。
Oct, 2023