Mar, 2020

利用多模态变分编码器 - 解码器框架预测微视频的受欢迎程度

TL;DR本文提出了一种用于微视频流行度预测任务的多模态变分编码器解码器(MMVED)框架,其学习一个随机高斯嵌入式微视频,具有信息丰富性,同时保持内在的不确定性。通过深度变分信息瓶颈下界(IBLBO)的优化,学习的隐藏表达式对于流行度目标最具表现力,同时对微视频功能中的噪声最大压缩。此外,将贝叶斯专家乘积原理应用于多模态编码器,综合利用所有可用的模态来决定信息的保留或丢弃。在公共数据集和我们从 Xigua 收集的数据集上进行的大量实验显示出所提出的 MMVED 框架的有效性。