Apr, 2021

一段视频胜似三番观:基于三支脉络变换器的视频人物再识别

TL;DR本文中提出了一种名为 “三叉神经变压器” 的框架,通过将原始视频数据转化为不同的特征域,同时使用自监督学习的三个自视图变压器和一个交叉视图变压器来增强信息并提取更全面的视频标识,实现了公共 Re-ID 基准上优于其他最先进方法的表现。