Apr, 2020

无监督多模态视频到视频的自监督学习翻译

TL;DR该研究提出了一个名为 UVIT 的新型无监督视频到视频翻译模型,采用专用编码器 - 解码器结构和双向循环神经网络单元,通过风格内容分解机制使得其能够实现样式一致的视频翻译结果,并通过更改输入帧和风格码提出一种视频内插损失,可以以自我监督的方式训练建筑块。该模型能够以多模式方式生成现实照片和时空一致性的翻译视频。