Apr, 2024

LTOS: 布局可控的文本对象合成通过自适应交叉关注融合

TL;DR通过将文本渲染和布局到图像生成任务融合为一个任务,本文提出了一种布局可控的文本 - 对象综合 (LTOS) 任务,旨在根据预定义的对象布局和文本内容合成具有对象和视觉文本的图像。