粗到细级联平滑预测网络用于视频面部表情识别
本文提出了一种基于深度卷积神经网络和条件随机场模型的视频面部表情识别方法,该模型从面部图像中提取空间信息和视频帧之间的时间关系,并在三个公共数据库上进行了实验证明,该模型在跨数据库实验中表现出色,并在主体独立实验中获得与现有模型相当的成果。
Mar, 2017
本文提出了一种用于面部表情识别的多尺度时空图卷积网络 (SpoT-GCN),通过接受域自适应滑窗策略提取更稳健的动态特征,并通过面部图形表示将微妙的动态特征转换为学习到的时空图模式,并使用提出的面部局部图池化 (FLGP) 从多个尺度的面部图结构中学习局部和全局特征,此外,引入了有监督对比学习来增强模型对难以分类的帧的区分能力。在 SAMM-LV 和 CAS (ME)^2 数据集上的实验结果表明,我们的方法在微表情识别方面达到了最先进的性能,消融研究进一步验证了我们提出的模块的有效性。
Mar, 2024
本研究提出了一种结合深度卷积神经网络(DCNN)和 Haar Cascade 深度学习架构的混合模型,用于将实时和数字面部图像分类到七种面部表情类别之一。实验结果表明,与其他模型相比,该架构在分类性能上具有显著优势,并且准确率高达 70%,执行时间短,为 2098.8 秒。
Jun, 2022
本文提出了一种名为 “交叉块细粒度语义级联(CFSC)” 的模块来改善人体动作视频识别的问题,并在实验结果中展示了 CFSC 模块在动作分类方面的优势。
Apr, 2024
本文提出了一种由多个利用卷积神经网络和大规模人脸识别数据集进行训练得到的强大行业级人脸识别网络组成的集成模型,该模型对视频中的空间和音频特征进行捕获,从而提高情绪识别的准确性,并在不使用视觉时间信息的情况下,将测试集的最佳结果提高了约 1%,实现了 60.03%的分类准确度。
Nov, 2017
该研究提出了一种 Subspace Pyramid Fusion Network (SPFNet) 的编码解码结构,旨在提高像素级分割的性能,并采用多尺度 / 全局上下文信息进行上下文聚合,通过实验结果表明该方法在语义分割方面与其他现有技术相当竞争力。
Apr, 2022
提出了一种基于 Multi-Region Ensemble CNN (MRE-CNN) 框架的面部表情识别方法,结合深度学习方法和 CNN,同时捕捉全局和局部特征确定面部表情,经过实验证明,取得了最新的识别精度。
Jul, 2018
我们提出了组件化特征聚合网络(C-FAN)作为视频人脸识别的新方法。C-FAN 自适应地将深层次特征向量聚合成一个单独的 512 维的表示一个视频序列的特征向量来实现出色的性能表现。
Feb, 2019
本研究旨在通过双通道 SlowFast 网络以及特殊的特征融合方法,有效提取连续手语识别中的时空特征,并在多个数据集上展示了该模型在空间和动态表示方面的优势。
Sep, 2023