关键词natural human-computer interaction
搜索结果 - 2
- 野外双流感性音视频分析
本文介绍了我们提交到 ABAW 2020 竞赛的两条流声音视觉分析模型来识别视频中的情感行为。该模型分别处理音频和图像流,并使用卷积神经网络进行分析,同时使用人脸对齐期间提取的附加功能。在训练期间,利用不同情感表达之间的相关性来提高性能。通 - SEWA DB:一份用于情感与情绪生动研究的丰富音视频数据库
SEWA 数据库提供了超过 2000 分钟的语音和视觉数据,包括来自六种文化、年龄在 18 至 65 岁之间的 398 人。此外,数据库还提供了基于面部和语音特征的多项标注,如面部标记、面部行动单元(FAU)、各种音频反应等等。这是情感计算