关键词unsupervised video prediction
搜索结果 - 2
- 无监督视频预测中解开物理动力学和未知因素的区别
介绍了一种两分支深度体系结构(PhyDNet)和新的递归物理单元(PhyCell),用于利用 PDE 描述的物理知识改进无监督视频预测方法,并且在四个不同的数据集上进行了广泛实验,表明了 PhyDNet 超越了现有方法的能力。
- ACL使用视频和蕴含生成的多任务视频字幕生成
通过多任务学习模型,结合无监督视频预测和语言蕴涵生成任务,共享参数学习提取更丰富的视频编码器表示和更好的视频 - 标题解码器表示,显著提高视频字幕生成的性能,达到了多个标准数据集的最新水平。