May, 2024

探索一种基于多模态融合的深度学习网络用于面瘫检测

TL;DR通过融合多模态深度学习模型,利用非结构化数据(即带有面部线段的图像帧)和结构化数据(即面部表情特征),本研究旨在检测面部麻痹,并分析不同数据模式和多模态融合方法的效果,实验证明在不同数据模式中使用面部表情特征的前馈神经网络具有最高的准确率,为 76.22,而使用面部线段图像的基于 ResNet 的模型具有最高的召回率,为 83.47。当同时利用面部线段图像和面部表情特征时,多模态融合深度学习模型稍微提高了准确率至 77.05,但减少了召回率。