ECCVMar, 2022

Iwin: 基于 Transformer 和不规则窗口的人类 - 物体交互检测

TL;DR本文介绍了一种新型的 Transformer 模型 ——Iwin Transformer,该模型专为人物 - 物体交互检测(HOI detection)而设计,通过逐层进行标记表示学习和聚合来逐步提高其检测人物 / 物体和识别交互的能力,并在两种常用的数据集 HICO-DET 和 V-COCO 上验证了其有效性和高效性。