MMAug, 2017

基于统计学的 CNN 音频视觉特征选择用于瞬时估计人类情感状态

TL;DR使用卷积神经网络统计学习从互信息选择的最小冗余最大相关性的表情特征进行回归,可以高于传统的音频或视频特征,实时预测情感状态的准确度。