ECCVSep, 2022

StoryDALL-E:基于预训练文本到图像转换器的故事延续适应

TL;DR本文提出了一个可以基于现有的训练好的文本到图像转换模型生成连续图像和故事的方法,并加以改进。该方法利用任务特定的模块实现顺序图像生成和复制源图像中相关元素,并使用了全模型微调和基于提示的微调等策略进行参数调整。该方法在多个数据集上进行了测试,并通过生成故事情节的连续性检验了优点。最后,研究结果表明,在多个角色参与的叙述中,预训练模型的性能明显下降。