ICCVAug, 2019

多模态信息瓶颈下的非配对式图像语音合成

TL;DR本篇研究使用深度生成模型解决一种新的问题,即无配对数据下,跨模气物体生成的问题,该研究提出了一种跨模态生成方法,称为 skip-modal generation。通过学习共享模态下的多模概念瓶颈方法,该法实现了基于图片生成语音的跨模态生成,并在此基础上改进了传统的跨模态生成方法,证明了其在提高数据效率方面的优点。