EMNLPOct, 2022

通过视觉计划和令牌对齐实现基于人物的故事可视化

TL;DR本文提出了一种基于 VQ-VAE 和文本 - 视觉 - token 技术的故事可视化方法,通过引入角色预测模型和视觉 token 补全模型,实现了角色的有效重现和高质量图像序列的生成。