Apr, 2023

使用双编码器改进场景文本编辑的扩散模型

TL;DRDIFFSTE 是一个改善预训练扩散模型性能的双编码器设计框架,通过指令调整训练,实现了场景文本编辑中正确文本渲染和风格控制的任务,使其具有零 - shot 泛化能力。