Jan, 2023

视频人员重新识别的多阶段时空聚合变形器

TL;DR本文提出了一种新的 Multi-Stage Spatial-Temporal Aggregation Transformer,采用两个代理嵌入模块来全面感知输入个人的属性和身份信息;通过 SPA 模块进行自注意操作,并采用新设计的自注意力操作提取信息,同时引入了时间分块混洗以进一步提高模型的鲁棒性,在各个标准基准测试中也实现了最先进的准确性。