低秩逼近网络高效准确的场景文字检测

Jun, 2023

低秩逼近网络高效准确的场景文字检测

Efficient and Accurate Scene Text Detection with Low-Rank Approximation Network

Yuchen Su

TL;DR提出了一种名为 LRANet 的文本检测器，该方法基于双重匹配方案用于正样本，利用低秩近似的文本轮廓表示方法来处理不规则形状文本，提高速度与准确性，并在三个数据集上展示了该方法的比较优越性。

Abstract

Recently, regression-based methods, which predict parameter curves for localizing texts, are popular in scene text detection. However, these methods struggle to balance concise structure and fast post-processing,

scene text detection parameter curves dual matching scheme text contour representation method lranet

发现论文，激发创造

ContourNet: 迈向准确任意形状场景文本检测的更远一步

该论文提出了一种名为 ContourNet 的算法来解决场景文本检测中出现的误检和规模变化困难的问题，并通过 Adaptive Region Proposal Network 和 Local Orthogonal Texture-aware Module 两个模块达到了更为准确的任意形状文本检测。

Apr, 2020

TextRay: 基于轮廓的几何模型在任意形状场景文本检测中的应用

该研究提出了一种名为 TextRay 的任意形状文本检测方法，采用一次性无锚点框架中的自顶向下轮廓基准几何建模和几何参数学习，能够将复杂的几何布局编码为统一的表示，并输出仅经过一个 NMS 后处理的简单多边形检测。

Aug, 2020

自适应文本区域表示的任意形状场景文本检测

提出了使用适应性文本区域表示的鲁棒场景文本检测方法，利用文本区域提案网络提取文本提案，再通过细化网络对提案进行验证和优化。实验结果在五个基准上表明，这种方法在场景文本检测方面达到了最先进水平。

May, 2019

CT-Net: 通过轮廓变换器进行任意形状文本检测

通过渐进式轮廓回归及轮廓变换器，我们提出了一种名为 CT-Net 的新型任意形状场景文本检测框架，以解决前端轮廓初始化不准确、多阶段误差累积或局部信息聚合不足的限制，并通过大量实验验证了其在准确性和效率方面超越了现有方法。

Jul, 2023

EAST: 一种高效准确的场景文本检测器

本研究提出了一种简单而强大的场景文本检测流程，该流程可以直接预测全图中任意方向和四边形形状的单词或文本行，消除了不必要的中间步骤（例如候选聚合和单词划分），只需要一个神经网络进行操作，大大提升了检测的准确性和效率。

Apr, 2017

MSR: 多尺度形状回归在场景文本检测中的应用

本文提出了一种新的多尺度形状回归网络（MSR），能够在场景中定位不同长度、形状和曲率的文本行，并通过预测密集的文本边界点来探测场景文本，具有较高的文本行长度变化容忍度。此外，该多尺度网络对不同尺度的特征提取及融合表现出优异的容忍度，实验结果显示，在曲线和直线不同长度及取向的场景中，所提出的 MSR 算法具备优越的探测性能。

Jan, 2019

朝着无约束的端到端文本检测

一项新的网络模型使用实例分割方法和注意力模型识别和提取曲线形状的文本内容，并使用多步光学字符识别引擎提高识别准确性，大幅度领先现有模型的准确性。

Aug, 2019

重新思考不规则场景文本识别

本文介绍了基于矩形化的文字识别方法的一些技巧，使其在曲线文本数据集上表现出色，并在 ICDAR 2019 任意形状文本挑战中获得了较高的准确性。

Aug, 2019

自动矫正的鲁棒场景文本识别

我们提出了 RARE（具有自动矫正的强韧文本识别器），这是一种专门设计的深度神经网络，用于识别不规则文本，并能在多种基准测试上取得最先进或高度竞争性的表现。

Mar, 2016

滑动线点回归的形状鲁棒场景文本检测

本文提出了一种名为 SLPR 的新方法，用于在自然场景中检测任意形状的文本，可以适应许多目标检测体系结构，并在传统的 ICDAR2015 偶然场景文本基准和曲线文本检测数据集 CTW1500 上取得了竞争性的结果。

Jan, 2018