PAN++：高效准确的任意形状文本端到端定位

May, 2021

PAN++：高效准确的任意形状文本端到端定位

PAN++: Towards Efficient and Accurate End-to-End Spotting of Arbitrarily-Shaped Text

Wenhai Wang, Enze Xie, Xiang Li, Xuebo Liu, Ding Liang...

TL;DR本文提出了一个基于核心表示的端到端文本发现框架，可在自然场景中检测和识别任意形状的文本，并取得了竞争性的精度和高速度。

Abstract

Scene text detection and recognition have been well explored in the past few years. Despite the progress, efficient and accurate end-to-end spotting of arbitrarily-shaped text remains challenging. In this work, we propose an end-to-end →

text spotting arbitrarily-shaped text kernel representation end-to-end framework real-time applications

发现论文，激发创造

基于像素聚合网络的高效准确任意形状文本检测

本文提出了一种高效准确的任意形状文本检测器 Pixel Aggregation Network (PAN)，它配备了低计算成本的分割头和可学习的后处理，其中分割头由 Feature Pyramid Enhancement Module (FPEM) 和 Feature Fusion Module (FFM) 组成。通过预测相似向量准确地聚合文本像素的像素聚合 (PA) 实现可学习后处理。同时，该方法在几个标准基准测试中取得了优异的表现。

Aug, 2019

Text Perceptron: 面向端到端任意形状文本检测

本文提出了一种名为 Text Perceptron 的端到端可训练文本检测方法，利用基于分割的高效检测器和新颖的形状变换模块，实现了文本检测和识别部分的全局优化，取得了在多个基准测试数据集上的优异性能表现。

Feb, 2020

朝着无约束的端到端文本检测

一项新的网络模型使用实例分割方法和注意力模型识别和提取曲线形状的文本内容，并使用多步光学字符识别引擎提高识别准确性，大幅度领先现有模型的准确性。

Aug, 2019

自然场景下端到端文本识别

该研究提出了一种统一的网络，同时定位和识别文本，通过使用卷积特征和 $2$D 注意力模型实现对任意形状文本的鲁棒定位和识别，避免了中间过程，取得了包括正常及不规则文本在内的多个标准数据集的最佳表现。

Jun, 2019

基于渐进尺度扩张网络的形状稳健文本检测

本文介绍了一种名为 PSENet 的新型逐步缩放扩展网络，能够高精度检测任意形状的场景文字，该方法不仅能够解决任意形状文字的不准确问题，还能有效地解决邻近两个文本集实例合并等问题。

Mar, 2019

Mask TextSpotter v3：面向鲁棒性场景文本检测的分割网络

该研究提出了一种名为 Mask TextSpotter v3 的新的场景文本识别算法，采用 Segmentation Proposal Network（SPN）代替 RPN，从而可以更准确和有效地识别和处理极端宽高比或不规则形状的文本实例，并且识别精度不会受到附近文本或背景噪声的干扰。在多个数据集上的实验中，该算法已实现最优性能。

Jul, 2020

Mask TextSpotter：一种端到端可训练神经网络，用于检测任意形状的文本

本文提出了一种名为 Mask TextSpotter 的针对场景文本定位和识别问题的端到端训练的神经网络模型，并在 ICDAR2013、ICDAR2015 和 Total-Text 数据集上进行了实验，展现出在场景文本检测和端到端文本识别任务方面的最新水平。

Jul, 2018

任意形状文本检测的核心提案网络

本文提出了一个名为 KPN 的创新型 Kernel Proposal Network 用于任意形状文本检测，该方法通过预测高斯中心图，从嵌入特征图中提取候选动态卷积核以分离邻近文本实例，同时通过正交约束保证核的独立性，进而将各个核分别卷积输入特征图并生成文本实例的嵌入图，最终有效地解决了邻近文本实例粘连问题，并取得了优异的性能表现。

Mar, 2022

SPTS：单点文字定位

提出了一种新的场景文本识别方法，使用单点标注替代昂贵的边界框标注，将场景文本定位和识别视为序列预测任务，并使用自回归 Transformer 模型预测序列，可达到最先进的识别效果。

Dec, 2021

渐进式尺度扩增网络实现形状稳健文字检测

本研究提出一种基于分割的检测器，通过渐进式缩小文本实例并分别分割多个预测核以检测任意形状、且强邻近文本分离的文本实例，实现了在 ICDAR 基准测试中优于之前最佳结果的表现。

Jun, 2018