CVPRApr, 2023

ViPLO: 基于视觉 Transformer 和姿势条件自回路图的人 - 物交互检测

TL;DR本研究提出采用 Vision Transformer 结构的 Pose-Conditioned Self-Loop Graph (ViPLO) 模型,通过特定的人体节点更新方式和局部特征的加入,解决了在人和物体之间关系推理中的量化问题,并在公共基准上取得了最新的成果。