Apr, 2024
基于时空侧调整预训练基础模型的视频行人属性识别
Spatio-Temporal Side Tuning Pre-trained Foundation Models for Video-based Pedestrian Attribute Recognition
Xiao Wang, Qian Zhu, Jiandong Jin, Jun Zhu, Futian Wang...
TL;DR利用视频帧进行行人属性识别,通过精调预训练的多模态基础模型充分利用时间信息,采用视觉 - 语言融合策略和时空调参策略实现参数高效优化,通过多模态交互学习实现行人属性预测。