May, 2023

自适应上下文建模提升视觉故事生成

TL;DR提出了一种在编码器和采样阶段均采用自适应上下文建模的方法来改进文本到图像生成模型,实现了对视觉化故事生成的全局一致性的提升,取得了 PororoSV 和 FlintstonesSV 数据集上最佳 FID 分数和生成语义一致故事图像的优异性能。