May, 2023

Fusion-S2iGan:一种高效有效的语音图像生成单阶段框架

TL;DR采用音频表示与图像生成的融合结构,实现单阶段的语音到图像生成,比基于多阶段模块的现有方法更有效,更高效,性能与传统的文本到图像方法相当。