Feb, 2024

TransGOP:基于 Transformer 的凝视对象预测

TL;DR该研究介绍了一种基于 Transformer 的注视对象预测方法 TransGOP,该方法利用 Transformer 进行对象检测和建立远距离注视关系,采用对象到注视的交叉注意力机制来改善注视热图回归,并通过注视框损失实现整体框架的端到端训练。实验证明 TransGOP 在目标检测、注视估计和注视对象预测的所有任务上均取得了最先进的性能。