Apr, 2024

基于时空侧调整预训练基础模型的视频行人属性识别

TL;DR利用视频帧进行行人属性识别,通过精调预训练的多模态基础模型充分利用时间信息,采用视觉 - 语言融合策略和时空调参策略实现参数高效优化,通过多模态交互学习实现行人属性预测。