基于 PyTorch 的卷积神经网络的面部情绪识别

Dec, 2023

基于 PyTorch 的卷积神经网络的面部情绪识别

Facial Emotion Recognition using CNN in PyTorch

Deyuan Qu, Sudip Dhakal, Dominic Carrillo

TL;DR基于 PyTorch 库的卷积神经网络模型，用于实时识别面部表情，通过优化网络以及调整超参数达到改善空间复杂度的目的，研究面部情绪识别的相关问题。

Abstract

In this project, we have implemented a model to recognize real-time facial emotions given the camera images. Current approaches would read all data and input it into their model, which has high space complexity. Our model is based on the →

real-time facial emotions convolutional neural network space complexity pytorch library facial emotion recognition

发现论文，激发创造

深情感：利用注意力卷积网络进行面部表情识别

该文介绍了针对面部表情识别问题，提出了一种基于注意力卷积网络的深度学习方法，并采用可视化技术确定了识别不同情绪对应的重要面部区域，相比先前的模型在多个数据集上都取得了明显的改进。

Feb, 2019

利用预训练于大型人脸识别数据集上的卷积神经网络进行视频情感分类

本文提出了一种由多个利用卷积神经网络和大规模人脸识别数据集进行训练得到的强大行业级人脸识别网络组成的集成模型，该模型对视频中的空间和音频特征进行捕获，从而提高情绪识别的准确性，并在不使用视觉时间信息的情况下，将测试集的最佳结果提高了约 1％，实现了 60.03％的分类准确度。

Nov, 2017

深度神经网络对视频数据情绪识别的改进

本文通过使用卷积神经网络和循环神经网络来识别视频数据中的情感，分析两种神经网络对系统性能的贡献，并在实验中实现了优于基线和其他竞争方法的表现。

Feb, 2016

基于 CNN 的移动设备面部情感分析

该研究旨在设计、部署和评估应用于移动设备的基于卷积神经网络（CNN）的面部情感分析架构，通过提出三种 CNN 架构并在野外基准面部图像数据集上进行比较评估，发现这些架构在保持较高性能的同时最小化存储需求，并且可以部署在基于移动设备上实时视频流上，同时还实现了基于预测用户情感的音乐推荐界面。

Jul, 2018

能否准确使用 CNN 分类人类情绪？一项基于深度学习的面部表情识别研究

该研究探讨了 CNN 模型识别和分类人类面部表情（积极、中立、消极）的能力，通过对芝加哥人脸数据库的预处理数据进行训练，模型在 10,000 张图像上达到 75% 的准确率，表明实现准确分析人类情感以及实用情感人工智能的可能性。

Oct, 2023

实时卷积神经网络用于情感和性别分类

本文提出并实现了一个通用的卷积神经网络（CNN）构建框架，用于设计实时 CNN。我们通过创建一个实时视觉系统来验证我们的模型，在一个混合步骤中同时完成面部检测、性别分类和情感分类的任务。我们提供了训练过程设置的详细信息，并在标准基准集上进行了评估，报告了 IMDB 性别数据集中 96% 和 FER-2013 情感数据集中 66% 的准确性。此外，我们还介绍了最近的实时启用的引导反向传播可视化技术。引导反向传播揭示了权重变化的动态，并评估了学习到的特征。我们认为，仔细实施现代 CNN 架构、使用当前的正则化方法和可视化以前隐藏的特征对于缩小慢速性能和实时架构之间的差距是必要的。我们的系统通过在 RoboCup＠Home 比赛中使用的 Care-O-bot 3 机器人上部署进行了验证。我们的所有代码、演示和预训练的架构都在我们的公共存储库中以开源许可证发布。

Oct, 2017

使用视觉显著性和深度学习进行面部表情识别

我们开发了一个卷积神经网络来识别人类面部表情。我们将已有的卷积神经网络模型 fine-tune 到 CFEE 和 RaFD 数据集，测试准确率分别为 74.79% 和 95.71%。通过在一个数据集上训练模型，在另一个数据集上测试可以牵扯到泛化的结果，最广泛的实验中测试集的 top-1 准确率为 65.39%。

Aug, 2017

基于混合模型的实时情绪识别与预测

本研究提出了一种结合深度卷积神经网络（DCNN）和 Haar Cascade 深度学习架构的混合模型，用于将实时和数字面部图像分类到七种面部表情类别之一。实验结果表明，与其他模型相比，该架构在分类性能上具有显著优势，并且准确率高达 70％，执行时间短，为 2098.8 秒。

Jun, 2022

基于增强式深度 3D 卷积神经网络的人脸表情识别

本篇研究提出了在视频中进行情感识别的 3D 卷积神经网络方法，使用 3D Inception-ResNet 层及 LSTM 单元，从面部图像中提取空间关系和不同帧之间的时间关系，并利用面部关键点作为输入，该方法在四个公开数据库上的表现超过了现有最先进技术。

May, 2017

基于深度神经网络的端到端多模态情感识别

本研究提出了一种运用视觉和听觉模态的情感识别系统，其通过深度卷积神经网络提取语音特征，通过 50 层的深度残差网络提取视觉特征，并运用长短时记忆网络进行机器学习算法，通过对 AVEC 2016 情感识别研究挑战的 RECOLA 数据库的自发和自然情绪的预测，明显优于传统的以听觉和视觉手工制作特征为基础的方法。

Apr, 2017