该论文提出了一种名为 ContourNet 的算法来解决场景文本检测中出现的误检和规模变化困难的问题,并通过 Adaptive Region Proposal Network 和 Local Orthogonal Texture-aware Module 两个模块达到了更为准确的任意形状文本检测。
Apr, 2020
该研究提出了一种名为 TextRay 的任意形状文本检测方法,采用一次性无锚点框架中的自顶向下轮廓基准几何建模和几何参数学习,能够将复杂的几何布局编码为统一的表示,并输出仅经过一个 NMS 后处理的简单多边形检测。
Aug, 2020
提出了使用适应性文本区域表示的鲁棒场景文本检测方法,利用文本区域提案网络提取文本提案,再通过细化网络对提案进行验证和优化。实验结果在五个基准上表明,这种方法在场景文本检测方面达到了最先进水平。
May, 2019
通过渐进式轮廓回归及轮廓变换器,我们提出了一种名为 CT-Net 的新型任意形状场景文本检测框架,以解决前端轮廓初始化不准确、多阶段误差累积或局部信息聚合不足的限制,并通过大量实验验证了其在准确性和效率方面超越了现有方法。
Jul, 2023
本研究提出了一种简单而强大的场景文本检测流程,该流程可以直接预测全图中任意方向和四边形形状的单词或文本行,消除了不必要的中间步骤(例如候选聚合和单词划分),只需要一个神经网络进行操作,大大提升了检测的准确性和效率。
Apr, 2017
本文提出了一种新的多尺度形状回归网络(MSR),能够在场景中定位不同长度、形状和曲率的文本行,并通过预测密集的文本边界点来探测场景文本,具有较高的文本行长度变化容忍度。此外,该多尺度网络对不同尺度的特征提取及融合表现出优异的容忍度,实验结果显示,在曲线和直线不同长度及取向的场景中,所提出的 MSR 算法具备优越的探测性能。
Jan, 2019
一项新的网络模型使用实例分割方法和注意力模型识别和提取曲线形状的文本内容,并使用多步光学字符识别引擎提高识别准确性,大幅度领先现有模型的准确性。
Aug, 2019
本文介绍了基于矩形化的文字识别方法的一些技巧,使其在曲线文本数据集上表现出色,并在 ICDAR 2019 任意形状文本挑战中获得了较高的准确性。
我们提出了 RARE(具有自动矫正的强韧文本识别器),这是一种专门设计的深度神经网络,用于识别不规则文本,并能在多种基准测试上取得最先进或高度竞争性的表现。
Mar, 2016
本文提出了一种名为 SLPR 的新方法,用于在自然场景中检测任意形状的文本,可以适应许多目标检测体系结构,并在传统的 ICDAR2015 偶然场景文本基准和曲线文本检测数据集 CTW1500 上取得了竞争性的结果。
Jan, 2018