MMAug, 2023

TextPainter:基于视觉和文本理解的海报设计的多模态文本图像生成

TL;DRTextPainter 是一种新颖的多模态方法,利用上下文视觉信息和相应的文本语义生成文本图像,结合全局 - 局部背景图像作为风格提示并以视觉和文本的和谐为指导,通过语言模型和文本理解模块实现句子级和词级风格变化,该方法可生成适用于海报的视觉和语义和谐的文本图像。