MMAug, 2021

GTNet: 指导 Transformer 网络用于检测人物 - 物体交互

TL;DR文章介绍了 GTNet 模型,一种基于自注重的引导变换网络,它通过自注重将人和物体的视觉特征编码为空间上下文信息,从而增强了对人 - 物体交互的理解和检测。