Jan, 2020

人 - 物交互检测的视觉 - 语义图注意力网络

TL;DR通过双图注意力网络,可以动态地从主要的人 - 物关系和附属关系中聚合环境视觉、空间和语义信息以实现强大的消岐能力。