BriefGPT.xyz
Ask
alpha
关键词
transdetr
搜索结果 - 2
使用光流估计合成逼真的场景文本视频
本文介绍了一种名为 FlowText 的视频文字合成技术,通过利用光流估计,在低成本的情况下合成大量的文本视频数据,用于训练强健的视频文字定位器。实验证明,将 TransDETR 等通用检测器与 FlowText 结合使用,可以在 ICDA
→
PDF
a year ago
使用 Transformer 进行端到端的视频文本识别
本研究基于 Transformer 序列建模,提出了一个简单而有效的端到端视频文本识别框架 TransDETR,它能够同时处理文本检测、跟踪和识别,通过两个主要优点:1) 在长序列中使用文本查询跟踪和识别每个文本,2) 在四个视频文本数据集
→
PDF
2 years ago
Prev
Next