视频人脸识别特征聚合网络
本文介绍了一种神经汇聚网络(NAN)用于视频人脸识别,该网络由两个模块组成:特征嵌入模块和聚合模块,利用注意机制对变量数量的面部图像进行聚合,通过分类或验证损失训练 NAN 并打破 naive aggregation 方法的精度极限,达到了最先进的准确度。
Mar, 2016
我们提出了组件化特征聚合网络(C-FAN)作为视频人脸识别的新方法。C-FAN 自适应地将深层次特征向量聚合成一个单独的 512 维的表示一个视频序列的特征向量来实现出色的性能表现。
Feb, 2019
本文提出了 Frame Attention Networks(FAN)来自动突出视频中具有区分度的帧,进行面部特征的集成,并在 CK + 和 AFEW8.0 数据集上展开了广泛的实验,其效果表现出优越的性能,超过了基于 CNN 的其他方法并在 CK + 上取得了最优秀的性能。
Jun, 2019
通过 Frame Aggregation and Multi-Modal Fusion framework 框架,将注意力机制引入 NetVLAD 模块进行视频内的人物识别,同时引入了 Multi-Layer Multi-Modal Attention 模块进行多模态相关性建模,实验结果表明该方法优于其他现有方法。
Oct, 2020
本文提出了一种介于 3D 卷积和 CNN 特征融合之间的方法,使用卷积结构学习适当的模式,同时保留了特征流,并检验了该方法在 TSN、TRN 和 ECO 模型上的效果。
May, 2019
提出了一种称为 REAN 的循环嵌入汇聚网络,可用于集合到集合的人脸识别任务,并且相对于 LSTM 等采用先前训练嵌入的方法,REAN 学习如何聚合预先训练的嵌入,可以更加稳健地避免过拟合,而 REAN 相较于高质量聚合方法,可以利用上下文信息规避冗余帧导致的噪声干扰, 在三个公共数据集上的实验结果表明,相对于基线 CNN-LSTM 结构和高质量聚合方法, REAN 显着地提高了人脸识别的准确性。
Apr, 2019
本文提出了一种两阶段的特征融合范式,Cluster 和 Aggregate,用于无约束人脸识别,它能够适应大规模输入,维护顺序不变性,并通过聚类特征进行序列推理。实验结果表明,所提出的范式在无约束人脸识别中具有优越性。
Oct, 2022
提出一种名为 MG-RAFA 的关注特征汇聚模块,用于将空间 - 时间特征精细地聚合成具有判别性的视频级别特征表示,采用全局视图与卷积操作学习关注,并基于不同粒度的关系学习多粒度关注,实现了视频 ReID 任务上的最新成果。
Mar, 2020
本文中,我们提出了一种名为 FANet 的新型单阶段人脸检测器,它不仅实现了最新的性能,而且运行效率高。此外,我们还提出了一种分层损失来有效地训练 FANet 模型,并在几个公共人脸检测基准测试集上评估了所提出的 FANet 检测器,包括 PASCAL face、FDDB 和 WIDER FACE 数据集,在这些基准测试集上都获得了最新的结果。
Dec, 2017