ICCVSep, 2019

基于多模态深度模型的电影情感反应预测

TL;DR本研究旨在开发和分析多模态模型,预测观众观看电影片段时的情感反应。研究发现,通过提取 RGB 帧和光流的特征以及音频中的各种低级描述符,采用深度神经网络模型来进行情感预测更为精确。其中,光流特征比 RGB 视频更加信息含量丰富,且音频特征的预测精度高于视频特征。