May, 2019
视觉关系检测和场景图生成的上下文翻译嵌入
Contextual Translation Embedding for Visual Relationship Detection and Scene Graph Generation
Zih-Siou Hung, Arun Mallya, Svetlana Lazebnik
TL;DR提出一种基于 VTransE 方法的上下文增强翻译嵌入模型,可以捕捉常见和罕见关系,进而提升图像理解能力。该模型可以有效地识别已知关系和未知关系,同时在多个基准测试中取得了优秀的表现,特别是在场景图生成任务中表现尤为突出。