May, 2023

使用光流估计合成逼真的场景文本视频

TL;DR本文介绍了一种名为 FlowText 的视频文字合成技术,通过利用光流估计,在低成本的情况下合成大量的文本视频数据,用于训练强健的视频文字定位器。实验证明,将 TransDETR 等通用检测器与 FlowText 结合使用,可以在 ICDAR2015video 和 ICDAR2013video 等不同数据集上获得显著的结果。