CVPRFeb, 2023

将 CLIP 模型转化为场景文字检测器

TL;DR该研究提出了一种名为 TCM 的新方法,通过直接应用 CLIP 模型来进行文本检测,而不需要预先培训过程。实验证明该方法有助于现有场景文本检测方法的少样本学习能力,并且具有良好的领域自适应能力。