Apr, 2024

StoryImager:一个统一高效的故事可视化和完善框架

TL;DRStoryImager 是一个双向的、统一的、高效的框架,通过增强继承于预训练的文本到图像模型的 storyboard 生成能力实现双向生成。具体而言,我们引入了一种目标框架掩码策略来扩展和统一不同的故事图像生成任务。此外,我们提出了一种框架 - 故事交叉注意力模块,用于分解交叉注意力以实现局部保真度和全局一致性。此外,我们设计了一个上下文特征提取器,从整个故事线中提取上下文信息。广泛的实验结果证明了我们的 StoryImager 具有出色的性能。