CVPRMar, 2023

Gazeformer: 可扩展、有效、快速预测目标导向的人类注意力

TL;DR本文提出了一个名为 ZeroGaze 的新任务,即预测未曾搜索过的物体的视线,并开发了一种新的模型 Gazeformer,该模型在 Scanpath 预测中利用语义相似性,采用基于变压器的编码器 - 解码器架构,并在 ZeroGaze 设置中表现出明显优越性,同时在标准视觉搜索任务中比现有模型更快。