Feb, 2017

可视化翻译嵌入网络用于视觉关系检测

TL;DR提出了一种新的基于关系表示学习和卷积物体检测网络的视觉关系检测方法 VTransE,该方法可以有效地定位和预测复杂的视觉关系三元组,同时在两个大规模数据集上验证了其有效性。