CVPRApr, 2024

MambaPupil: 事件驱动的双向选择性循环模型用于眼动跟踪

TL;DR本文提出了 MambaPupil 网络作为一种稳定的基于事件的眼动追踪系统,其采用双向长期序列建模和时变状态选择机制,充分利用上下文时间信息以适应眼动的多样性和突变性。该网络利用多层卷积编码器从事件表示中提取特征,采用双向门控循环单元(GRU)和线性时变状态空间模块(LTV-SSM)选择性地捕获正向和反向时间关系中的上下文相关性。此外,该网络使用 Bina-rep 作为紧凑的事件表示,并提出了名为 Event-Cutout 的特定数据增强方法,通过对事件图像进行空间随机掩盖来增强模型的稳健性。在 ThreeET-plus 基准测试中,MambaPupil 表现出卓越的性能,在 CVPR'2024 AIS 基于事件的眼动追踪挑战中获得第一名。