Mar, 2023

LANDMARK:基于语言引导的场景图生成表示增强框架

TL;DR提出了一种基于语言引导的表示增强框架(LANDMARK),通过语言-视觉交互式模式、全局语言语境和对称谓相关性等方面学习谓词相关表示,从而在场景图生成领域中提高了性能和可兼容性。