Feb, 2020

通过丰富而公正的语义提取实现无偏见的场景图生成

TL;DR本文提出了一种新的网络体系结构 (RiFa),用于从视觉场景中提取图表示,以提高场景图任务的性能。实验证明,该方法在捕捉不同语义属性的关系方面表现显著优于其他方法,获得了最佳的总体性能