Jun, 2024

SceneTextGen: 使用扩散模型的无局限布局的场景文字图像合成

TL;DRSceneTextGen 是一种基于扩散模型的新颖方法,通过集成具有详细排版属性的字符级编码器,字符级实例分割模型和词级定位模型,以实现更自然和多样化的文本生成,从而提高了生成图像上的字符识别率。