CVPRApr, 2022

基于解缠的 Transformer 的人 - 物互动检测

TL;DR该研究旨在解决人 - 物交互检测中的联合定位和分类问题,通过提出解耦三元组预测为人 - 物对检测和交互分类两个子任务来学习关注不同区域的表示,从而设计出 Disentangled Transformer,与现有 HOI transformers 相比,其方法在两个公共 HOI 基准测试中表现更佳。