May, 2019

视觉关系检测和场景图生成的上下文翻译嵌入

TL;DR提出一种基于 VTransE 方法的上下文增强翻译嵌入模型,可以捕捉常见和罕见关系,进而提升图像理解能力。该模型可以有效地识别已知关系和未知关系,同时在多个基准测试中取得了优秀的表现,特别是在场景图生成任务中表现尤为突出。