Mar, 2024

长期框架-事件视觉跟踪:基准数据集和基线

TL;DR提出了一个新的长期和大规模帧事件单目标跟踪数据集(FELT),该数据集包含742个视频和1,594,474个RGB帧和事件流对,已成为迄今为止最大的帧事件跟踪数据集。通过引入现代Hopfield层到多头自注意力块中的联想记忆Transformer网络来融合RGB和事件数据,验证了模型的有效性。