- 上下文感知的长期数据集视频异常检测
该研究论文提出了一种面向长期监控场景的上下文感知视频异常检测算法 Trinity,该算法适用于拥挤场景,其中个体难以跟踪,异常是由速度、方向或群体运动缺失引起的。通过对上下文、外观和动作之间的对齐质量进行学习,Trinity 使用对齐质量来 - ICCV拥挤场景下鲁棒的帧间相机旋转估计
我们提出了一种从手持单目视频中估计拥挤真实场景中相机旋转的方法,通过在 SO (3) 上引入 Hough 变换,可在光流中高效而鲁棒地找到与之最相符的相机旋转,且在速度上比其他方法更准确。
- CVPR学习从复杂野外场景中恢复鲁棒的三维人体网格
该研究论文提出了一种名为 3DCrowdNet 的深度学习模型,利用 2D 人体姿态估计和基于关节回归的方法,从拥挤的实景图像中恢复出单个人的三维人体模型。
- 高效 DETR: 使用密集先验改进端到端目标检测器
本文提出使用密集先验初始化对象容器的方法,利用 Efficient DETR 同时利用密集检测和稀疏集检测,实现只有 3 个编码器层和 1 个解码器层的端到端物体检测,提高了算法效率和性能。在 MS COCO 数据集上的实验证明了该算法在拥 - ICCV多实例姿态网络:重新思考自上而下的姿态估计
提出了一种名为 Multi-Instance Pose Network (MIPNet) 的人体姿势估计模型,能够在给定边框范围内预测多个 2D 姿态实例,并引入了一种称为多实例调制块(Multi-Instance Modulation B - ECCV不要打扰我:在其他行人干扰下的人员再识别
这篇论文提出了一种名为 PISNet 的深度网络,它可以从拥挤的场景中准确地识别目标行人并去除其他人的干扰信息。通过使用 Query-Guided Attention Block (QGAB) 和 Multi-Person Separati - 基于人群密度图中的网络流量的目标多目标追踪算法
本文提出了一种新的基于人群密度图的多目标追踪(MOT)算法 —— 计数式追踪。通过联合建模检测、计数和跟踪多个目标为网络流算法,该算法同时找到全局最优的多个目标检测和轨迹。该方法在人员、细胞和鱼群跟踪等各领域的公共基准测试中表现出了良好的结 - AC-VRNN: 基于注意力机制的条件多变量循环神经网络用于多目标轨迹预测
本文提出了一种基于条件变分递归神经网络(C-VRNN)的生成式架构,用于多未来轨迹预测,在密集场景中有效地建模人类动作,并进行了公开数据集的广泛实验,证明了其在比较现有先进技术下的有效性。
- CVPR通过代表区域的 NMS:通过候选框配对实现拥挤行人检测
本文提出了一种新的代表区域 NMS 方法,利用较少被遮挡的可见部分,有效地去除冗余框而不带来太多的误报,同时还提出了一种新颖的配对框模型,以同时预测行人的全身和可见框,并在充满挑战的 CrowdHuman 和 CityPersons 基准测 - 通过主要目标抑制检测人群中的次要人员实例的 PS-RCNN
本文提出了一种名为 PS-RCNN 的人物检测方法,通过引入人形掩膜来解决高度遮挡的问题,使用两个 R-CNN 模块来检测图像中的不同部位的对象,以及 HRRA 模块以保留细节特征,相较于基准检测方法,在 CrowdHuman 数据集上提高 - HistoNet:预测物体实例尺寸直方图
该论文提出了一种在拥挤的场景下通过直接预测对象大小的直方图,而无需进行任何显式的对象实例分割的方法,该方法通过直接学习对象大小的直方图来提高准确性,从而为不需要像素精确的实例分割但对实例大小分布有兴趣的应用场景提供了很大的帮助。
- 带有社交图网络的随机轨迹预测
通过使用动态构建的有向社交图和时序随机方法与 LSTMs 结合的预测,并结合个人、社交特征为目标生成的代表,成功预测了行人轨迹,特别是在拥挤的场景中。
- CVPR19 跟踪和检测挑战赛:有多拥挤?
本研究提出了一个新的 CVPR19 基准测试,该测试包括 8 个新序列,重点关注极度拥挤的场景下的多目标跟踪,并将在第四届 BMTT MOT 挑战工作坊上进行评估。
- CrowdPose:高效的拥挤场景姿态估计和新基准
本研究提出一种新颖的、高效的多人姿态估计方法,通过图模型的全局关键点最大化关联和每个关节的多峰预测,实现在拥挤场景下的准确姿态估计和高效推理,并提供新的数据集以更好地评估算法。在 CrowdPose 数据集上,本方法的 mAP 优于最先进的 - ECCVOcclusion-aware R-CNN: 检测人群中的行人
本文提出一种新的遮挡感知 R-CNN (OR-CNN) 检测算法来提高人群中行人检测的准确率,其中使用的新型聚合损失来将建议的探测框紧密地与相应的对象定位;使用新的部分遮挡感知 ROI 池化单元来整合人体结构的前期结构信息以及可见性预测到网 - 使用生成对抗网络在视频中检测异常事件
在拥挤的场景中,利用生成对抗网络(GANs)解决异常检测问题。通过只使用正常数据对 GANs 进行训练,学习场景的正常表征,进而在测试时通过对比真实数据和 GANs 重构的外观和运动表征,并计算局部差异检测出异常区域,在帧级和像素级异常检测 - 深度异常:用于拥挤场景中快速检测异常的全卷积神经网络
本文基于卷积神经网络、时间序列数据,提出了一种有效的视频异常检测与定位方法,通过实验结果表明该方法在准确性方面胜过现有方法。
- NIPS拥挤场景下的端对端人体检测
通过图像解码生成人员检测集合的模型,利用 LSTM 层进行序列生成,使用新的损失函数进行端到端的训练,并成功地解决了在拥挤场景中检测人员的挑战性任务。