基于时间注意力机制的视频行人属性识别方法
利用视频帧进行行人属性识别,通过精调预训练的多模态基础模型充分利用时间信息,采用视觉 - 语言融合策略和时空调参策略实现参数高效优化,通过多模态交互学习实现行人属性预测。
Apr, 2024
本文介绍了一种利用周围的行人图像 context,比传统的基于 SVM 方法更好地推断行人属性的方法,并通过我们新发布的行人属性数据集进行实验评估背景和前景特征对属性识别的相关性。
Jan, 2015
本文提出了一种基于时空图的长短期记忆神经网络,用于在拥挤环境中预测行人的轨迹,考虑与场景中的静态和动态元素的交互,结果表明,相比于其他方法,本方法在人类轨迹预测方面能够将平均位移误差(ADE)和最终位移误差(FDE)分别降低高达 55%和 61%。
Feb, 2019
本文介绍了一个基于端到端学习框架的人行属性推断方法,将其作为多标签图像分类任务,以此来处理属性之间的语义关系并在三个挑战性数据集上得到了显著提升。
Jul, 2017
本文提出了一种基于元学习的方法,以解决行人属性识别中存在的增量 few-shot 学习情形,实验表明该方法在 PETA 和 RAP 基准数据集上取得了具有竞争力的性能和低资源需求。
Jun, 2019
提出适用于行人属性识别的属性定位模块 (ALM),以自适应方式发现最具有区分性的区域并学习每个属性的区域特征,并引入特征金字塔架构以实现低水平的属性特定局部化。
Oct, 2019
本文介绍了一种基于多任务学习的模型,通过一个复合场景的框架实现了车载摄像头下的行人检测和 32 种行人属性的识别,其中包括道路等待行为的预测,结果在自动驾驶领域表现出竞争力和稳定性。
Dec, 2020
该文综合研究和比较了视频人员重识别的四种不同的时间建模方法,包括时间汇聚,时间关注,RNN 和 3D 卷积神经网络,并提出了一个采用时间卷积的注意力生成网络,用于在帧之间提取时间信息。在 MARS 数据集上进行评估,并通过一大部分超越了最新技术的方法。
May, 2018
该论文对行人属性识别的现状进行了回顾和思考,并提出了两个根据零样本设置构建的数据集 PETA extsubscript {$ZS$} 和 RAP extsubscript {$ZS$},介绍了多个用于未来评估的真实准则,还重新实现了现有的最新方法,并引入了一个强大的基准方法,以在现有数据集和两个提议的数据集上进行实验,以测量行人属性识别的进展。
Jul, 2021