Nov, 2023

利用扩散模型对野外场景文字进行操作

TL;DR通过引入基于扩散的场景文本操作网络(DBEST),我们设计了两种适应策略,即一次性样式适应和文本识别引导,在各种场景文本数据集上进行了全面评估和比较,并提供了深入的消融研究来分析我们的性能提升。此外,我们还展示了我们提出的方法在合成场景文本方面的有效性,通过竞争的光学字符识别(OCR)准确度,在 COCO-text 和 ICDAR2013 数据集上达到了 94.15% 和 98.12% 的字符级评估。