Dec, 2019

一种实时的全球推断网络用于一阶段指称表达理解

TL;DR本篇论文提出了一种名为 Real-time Global Inference Network 的模型,它使用了关注全局和自适应特征融合机制来实现图像中目标区域与给定文本描述之间的关联,相比于现有多个阶段的模型,该模型可以实现更快的速度,并且在多个数据集上表现出较高的准确度。