句法规划在组合式图像字幕生成中的作用
该论文研究了图像编码模型的组合推广问题,使用多任务模型相结合的方法,结合了描述生成和图像 - 句子排序,并使用重新排序的解码机制,该模型在描述未见过的概念时比现有现有模型表现更好。
Sep, 2019
本文提出一种基于神经机器翻译的新模型 Syntactic Attention,采用分离语法与语义学习的方式训练,拥有捕捉人类语言组成性结构的能力,相较于标准深度学习方法在具有组成性泛化任务的数据集 SCAN 上表现显著优异。
Apr, 2019
本文提出了一种用于图像字幕生成的可分解的相互递归生成过程,通过对语义和句法明确的因式分解,更好地保留了语义内容。所提出的组合过程需要较少的数据进行训练,并具有更好的广义和多样性。
Oct, 2018
该研究系统比较了序列到序列模型和基于组合原则的模型在 COGS 语料库上处理组合泛化能力的能力,在结构泛化任务中,基于序列的模型表现接近零,而组成模型在结构泛化任务中表现接近完美,这表明结构泛化是组成泛化的关键度量,需要能够处理复杂结构的模型。
Feb, 2022
利用句法结构的注意力屏蔽技术从根本上提高了组合概括的重要性,特别是在多模式环境中的语义根基问题。通过在 Transformer 编码器中的权重共享,依赖解析在不同任务中推动了基于语法的组合概括的最新研究。这些结果提高了多模式语义根基和参数高效建模的技术水平,并为未来的研究提供了深入洞察。
Nov, 2023
通过自然语言句子中的识别视觉实体和将其按照二维空间布局排列,需要对语言和空间进行构造性理解。本研究通过对比显示,如果句子提到了在训练期间看到的类似实体关系,则可以从隐式或显式编码句子句法的语言表示中预测布局。为了测试构造性理解,我们收集了一组语法正确的测试句子和布局,它们描述了在训练期间很可能没有见过的实体和关系的组合。结果显示,在这个测试集上的表现大幅下降,表明当前模型依赖于训练数据中的相关性,并且在理解输入句子的结构方面存在困难。我们提出了一种新颖的结构损失函数,更好地强制执行输入句子的句法结构,并在以文本为条件的 2D 空间布局预测任务中取得了显著的性能提升。该损失函数有潜力在其他生成任务中使用,其中基础的调节方式是树状结构。代码、训练模型和 USCOCO 评估集将通过 GitHub 提供。
Jan, 2024