EMNLPOct, 2022
通过视觉计划和令牌对齐实现基于人物的故事可视化
Character-Centric Story Visualization via Visual Planning and Token Alignment
Hong Chen, Rujun Han, Te-Lin Wu, Hideki Nakayama, Nanyun Peng
TL;DR本文提出了一种基于 VQ-VAE 和文本 - 视觉 - token 技术的故事可视化方法,通过引入角色预测模型和视觉 token 补全模型,实现了角色的有效重现和高质量图像序列的生成。