Nov, 2023

AutoStory: 以最小化人力投入生成多样化的故事图像

TL;DR自动化故事可视化系统通过大规模语言模型的理解和规划能力进行布局规划,然后利用大规模文本到图像模型生成基于布局的复杂故事图像,通过密集条件生成模块将简单边界框布局转换为草图或关键点控制条件增加生成图像质量和简便的用户交互,同时提出了一种简单而有效的多视角一致的角色图像生成方法,消除了依赖人力收集或绘制角色图像的需求。