用于多视角人脸检测的聚合通道特征
本研究提出了一种新的多视角检测系统 MVDet,采用基于鸟瞰图的无 Anchor 盒方法来聚合视图信息并在地平面特征图上应用大内核卷积。在新引入的合成数据集 MultiviewX 上的结果表明,相比于现有方法在 Wildtrack 数据集上的最新技术,该方法提高了 14.1% 的 MODA 性能。
Jul, 2020
本文提出了一个统一框架来模拟多个表现良好的行人检测器,其中包含了中间层过滤低级特征和使用增强决策森林算法。通过使用过滤的渠道特征,仅仅使用 HOG + LUV 的低级特征使我们在具有挑战性的 Caltech 和 KITTI 数据集上获得了最佳性能,当加入光流特征时,我们在 Caltech 数据集上获得了最好的检测效果,1 个 FPPI 时达到了 93% 的召回率。
Jan, 2015
该研究提出了一种基于流引导特征聚合的视频物体检测学习框架,该框架通过沿着运动路径聚合邻近特征来提高视频的识别精度,避免了视频中物体外观退化的问题,并且完全可训练,与 ImageNet VID 挑战的最佳工程系统相当
Mar, 2017
我们提出了组件化特征聚合网络(C-FAN)作为视频人脸识别的新方法。C-FAN 自适应地将深层次特征向量聚合成一个单独的 512 维的表示一个视频序列的特征向量来实现出色的性能表现。
Feb, 2019
本文中,我们提出了一种名为 FANet 的新型单阶段人脸检测器,它不仅实现了最新的性能,而且运行效率高。此外,我们还提出了一种分层损失来有效地训练 FANet 模型,并在几个公共人脸检测基准测试集上评估了所提出的 FANet 检测器,包括 PASCAL face、FDDB 和 WIDER FACE 数据集,在这些基准测试集上都获得了最新的结果。
Dec, 2017
本文提出了一种两阶段的特征融合范式,Cluster 和 Aggregate,用于无约束人脸识别,它能够适应大规模输入,维护顺序不变性,并通过聚类特征进行序列推理。实验结果表明,所提出的范式在无约束人脸识别中具有优越性。
Oct, 2022
该研究提出了一种基于多层通道特征的统一框架,通过将 HOG+LUV 和 CNN 的各层整合在一起,学习了一个多级级联 AdaBoost,使得在 Caltech 行人数据集上的漏检率为 10.40%,使用新的准确注释后,漏检率为 7.98%,并且检测速度比现有技术有 1.43 倍的加速,并具有可行性损失。
Mar, 2016
本文介绍了一种神经汇聚网络(NAN)用于视频人脸识别,该网络由两个模块组成:特征嵌入模块和聚合模块,利用注意机制对变量数量的面部图像进行聚合,通过分类或验证损失训练 NAN 并打破 naive aggregation 方法的精度极限,达到了最先进的准确度。
Mar, 2016
本文提出了一种基于卷积神经网络的级联特征聚合方法 (Cascade Feature Aggregation, CFA),该方法可以有效地提高人体姿态估计的精度,并且在 MPII 数据集和 LIP 数据集上实现了最佳成绩。
Feb, 2019