CVPRMar, 2021

将 HOI 检测重构为自适应集合预测

TL;DR本文提出一种基于 Adaptive Set Prediction 的 AS-Net 框架,通过多头注意力聚合查询集和全局上下文推理交互相关特征,同时使用实例感知注意模块将实例分支的特征引入交互分支,以实现更为准确高效的人物 - 物体交互检测。本方法在三个 HOI 检测数据集上实现比前沿方法更好的结果,尤其在大规模 HICO-DET 数据集上,相对于之前的最优结果实现了超过 31% 的性能提升。