自适应边界建议网络用于任意形状文本检测
提出了使用适应性文本区域表示的鲁棒场景文本检测方法,利用文本区域提案网络提取文本提案,再通过细化网络对提案进行验证和优化。实验结果在五个基准上表明,这种方法在场景文本检测方面达到了最先进水平。
May, 2019
本文提出了一种基于关系推理图网络的新型统一任意形状文本检测方法,其中使用 CNN 和 GCN 构建创新的局部图模型将任意形状文本实例划分成一系列小矩形组件,通过深度的关系推理网络进行推理,实验表明该方法在公开数据集上具有最先进的性能。
Mar, 2020
该论文提出了一个基于端到端文本检测的点定位方法,通过定位文本边界上的一组点,建立了一种简单而有效的方案,可读取任意形状的文本,并在 ICDAR2015,TotalText 和 COCO-Text 三个数据集上展开实验,实验结果表明,该方法在场景文本检测和端到端文本识别任务上均超过了现有技术水平。
Nov, 2019
通过渐进式轮廓回归及轮廓变换器,我们提出了一种名为 CT-Net 的新型任意形状场景文本检测框架,以解决前端轮廓初始化不准确、多阶段误差累积或局部信息聚合不足的限制,并通过大量实验验证了其在准确性和效率方面超越了现有方法。
Jul, 2023
该研究提出了一种名为 TextRay 的任意形状文本检测方法,采用一次性无锚点框架中的自顶向下轮廓基准几何建模和几何参数学习,能够将复杂的几何布局编码为统一的表示,并输出仅经过一个 NMS 后处理的简单多边形检测。
Aug, 2020
本文提出了一个名为 KPN 的创新型 Kernel Proposal Network 用于任意形状文本检测,该方法通过预测高斯中心图,从嵌入特征图中提取候选动态卷积核以分离邻近文本实例,同时通过正交约束保证核的独立性,进而将各个核分别卷积输入特征图并生成文本实例的嵌入图,最终有效地解决了邻近文本实例粘连问题,并取得了优异的性能表现。
Mar, 2022
该论文提出了一种名为 ContourNet 的算法来解决场景文本检测中出现的误检和规模变化困难的问题,并通过 Adaptive Region Proposal Network 和 Local Orthogonal Texture-aware Module 两个模块达到了更为准确的任意形状文本检测。
Apr, 2020
本文提出了一种新颖的边界点动态优化(BPDO)的任意形状场景文本检测器,该模型通过基于分割的文本感知模块(TAM)和边界点动态优化模块(DOM)实现。实验证明,该模型在 CTW-1500、Total-Text 和 MSRA-TD500 数据集上的性能优于或可与最先进算法相媲美,证明了该模型的有效性。
Jan, 2024