面部表情识别的协方差池化
本文提出了一种基于深度卷积神经网络和条件随机场模型的视频面部表情识别方法,该模型从面部图像中提取空间信息和视频帧之间的时间关系,并在三个公共数据库上进行了实验证明,该模型在跨数据库实验中表现出色,并在主体独立实验中获得与现有模型相当的成果。
Mar, 2017
本文提出了一种基于时间注意力和内帧关联的计算方式 ——Temporal-attentive Covariance Pooling (TCP),它可以灵活地集成到任何视频架构中,用于生成强大的视频表示,它在六个基准测试中都表现出优异的性能,并具有强大的泛化能力。
Oct, 2021
该论文提出了一种基于高级特征的协方差汇集方法,即 Matrix Power Normalized Covariance (MPN-COV),并在 ImageNet 上的测试中表现出了显著的成果,特别是在 AlexNet,VGG-M 和 VGG-16 的情况下,MPN-COV 方法可以使性能提高超过 3%,并且与 ResNet-152 相媲美。
Mar, 2017
提出了一种基于 Multi-Region Ensemble CNN (MRE-CNN) 框架的面部表情识别方法,结合深度学习方法和 CNN,同时捕捉全局和局部特征确定面部表情,经过实验证明,取得了最新的识别精度。
Jul, 2018
该研究提出了一种适用于高维度、小样本场景的全局矩阵幂归一化协方差池化, 并引入了一个全局高斯嵌入网络来融合一阶统计信息。此方法在大规模对象分类、场景分类、细粒度视觉识别和纹理分类方面的实验表明,其优于现有的方法,并取得了最佳效果。
Apr, 2019
该文介绍了针对面部表情识别问题,提出了一种基于注意力卷积网络的深度学习方法,并采用可视化技术确定了识别不同情绪对应的重要面部区域,相比先前的模型在多个数据集上都取得了明显的改进。
Feb, 2019
我们开发了一个卷积神经网络来识别人类面部表情。我们将已有的卷积神经网络模型 fine-tune 到 CFEE 和 RaFD 数据集,测试准确率分别为 74.79% 和 95.71%。通过在一个数据集上训练模型,在另一个数据集上测试可以牵扯到泛化的结果,最广泛的实验中测试集的 top-1 准确率为 65.39%。
Aug, 2017
本文提出了一种用于面部表情识别的多尺度时空图卷积网络 (SpoT-GCN),通过接受域自适应滑窗策略提取更稳健的动态特征,并通过面部图形表示将微妙的动态特征转换为学习到的时空图模式,并使用提出的面部局部图池化 (FLGP) 从多个尺度的面部图结构中学习局部和全局特征,此外,引入了有监督对比学习来增强模型对难以分类的帧的区分能力。在 SAMM-LV 和 CAS (ME)^2 数据集上的实验结果表明,我们的方法在微表情识别方面达到了最先进的性能,消融研究进一步验证了我们提出的模块的有效性。
Mar, 2024