Sep, 2016

Deep Impression: 音 / 视多模态深度残差网络用于鉴别明显人格特质

TL;DR本文使用音视频深度残差网络进行多模态明显人格特质识别,并针对大五人格特征进行端到端训练。该网络无需进行特征工程或视觉分析,如面部检测、面部标定或面部表情识别。近期,在 ChaLearn 第一印象赛中获得第三名,测试准确率为 0.9109。