scene text editing (STE) aims to substitute text in an image with new desired
text while preserving the background and styles of the original text. However,
present techniques present a notable challenge in the generation of edited text
images that exhibit a high degree of clarity and
本文提出了一种名为 FAST 的新颖无字体场景文本编辑框架,用于在保留自然和逼真外观的同时,同时在任意样式和位置生成文本,通过结合遮罩生成和样式转移。通过滤波机制去除背景干扰,使网络仅集中于需要编辑的文本区域,同时设计了文本样式转移模块以减轻不同字长度带来的挑战,实验证明该方法在质量和数量上优于现有方法。
本文提出了一种 Stroke-Aware Scene Text Image Super-Resolution 方法,通过设计规则分解英文字符和数字,设计 Stroke-Focused Module(SFM)以集中于字符的笔画级内部结构,旨在通过预训练文本识别器为位置提供笔画级别的注意力图,并控制所生成的超分辨率图像与高分辨率真实值之间的一致性,从而实现低分辨率场景文本图像识别的目的。