BriefGPT.xyz
Ask
alpha
关键词
audio and visual features
搜索结果 - 3
AttendAffectNet: 基于自注意力网络从电影中预测情感响应
本文提出不同变体的自我注意力机制网络,用于从电影中预测情感,融合音频和视频,结合多模态关系,并将自我注意力机制应用于情感预测的特征提取中,证明其在 COGNIMUSE 数据集和 MediaEval 2016 情感影响任务中比时域的自我注意力
→
PDF
4 years ago
ICCV
综合视频理解:基于内容的视频推荐器设计的视频摘要
该论文将视频摘要提出了内容为基础的推荐问题,使用可扩展的深度神经网络在显式建模的片段和视频上进行预测,通过场景和动作识别来寻找视频理解任务不同方面之间的相关性,同时讨论音频和视觉特征在总结任务中的影响,并通过数据增强和多任务学习来防止模型过
→
PDF
5 years ago
ECCV
双模态音视频时间顺序深度学习与随机视觉特征应用于第一印象识别
本文提出一种基于短视频中的大五人格特质进行第一印象识别的新方法,使用双模态深度神经网络结构和少量帧的音频和视觉特征进行训练,并在使用 ChaLearn LAP APA2016 数据集进行评估时表现出色。
PDF
8 years ago
Prev
Next