通过边界变换进行任意形状文本检测

ICCVMay, 2022

通过边界变换进行任意形状文本检测

Arbitrary Shape Text Detection via Boundary Transformer

Shi-Xue Zhang, Chun Yang, Xiaobin Zhu, Xu-Cheng Yin

TL;DR通过边界学习，分层迭代地优化边界变形并结合边缘提议模块，从而在有效地定位文本边界的同时，简单高效地检测任意形状的文本。

Abstract

In arbitrary shape text detection, locating accurate text boundaries is challenging and non-trivial. Existing methods often suffer from indirect text boundary modeling or complex post-processing. In this paper, we systematically present a unified coarse-to-fine framework via

arbitrary shape text detection boundary learning iterative boundary transformer feature extraction boundary proposal module

发现论文，激发创造

自适应边界建议网络用于任意形状文本检测

该文提出一种基于神经网络的边界生成方法，能够直接生成准确的任意形状文本边界而无需后处理，实验表明该方法在公开数据集上取得了良好的效果。

Jul, 2021

只需边界：面向任意形状的文本识别

该论文提出了一个基于端到端文本检测的点定位方法，通过定位文本边界上的一组点，建立了一种简单而有效的方案，可读取任意形状的文本，并在 ICDAR2015，TotalText 和 COCO-Text 三个数据集上展开实验，实验结果表明，该方法在场景文本检测和端到端文本识别任务上均超过了现有技术水平。

Nov, 2019

CT-Net: 通过轮廓变换器进行任意形状文本检测

通过渐进式轮廓回归及轮廓变换器，我们提出了一种名为 CT-Net 的新型任意形状场景文本检测框架，以解决前端轮廓初始化不准确、多阶段误差累积或局部信息聚合不足的限制，并通过大量实验验证了其在准确性和效率方面超越了现有方法。

Jul, 2023

Text Perceptron: 面向端到端任意形状文本检测

本文提出了一种名为 Text Perceptron 的端到端可训练文本检测方法，利用基于分割的高效检测器和新颖的形状变换模块，实现了文本检测和识别部分的全局优化，取得了在多个基准测试数据集上的优异性能表现。

Feb, 2020

基于 Transformer 的场景文本识别

本论文提出了一种基于 transformer 的简单但极其有效的场景文本识别方法，只需要空间注意力而不需要矫正图像，仅使用卷积特征图作为单词嵌入输入到 transformer 中，并在大规模实验中取得了显著的优越性能。

Mar, 2020

朝着无约束的端到端文本检测

一项新的网络模型使用实例分割方法和注意力模型识别和提取曲线形状的文本内容，并使用多步光学字符识别引擎提高识别准确性，大幅度领先现有模型的准确性。

Aug, 2019

TextRay: 基于轮廓的几何模型在任意形状场景文本检测中的应用

该研究提出了一种名为 TextRay 的任意形状文本检测方法，采用一次性无锚点框架中的自顶向下轮廓基准几何建模和几何参数学习，能够将复杂的几何布局编码为统一的表示，并输出仅经过一个 NMS 后处理的简单多边形检测。

Aug, 2020

边界点动态优化：任意形状场景文本检测

本文提出了一种新颖的边界点动态优化（BPDO）的任意形状场景文本检测器，该模型通过基于分割的文本感知模块（TAM）和边界点动态优化模块（DOM）实现。实验证明，该模型在 CTW-1500、Total-Text 和 MSRA-TD500 数据集上的性能优于或可与最先进算法相媲美，证明了该模型的有效性。

Jan, 2024

基于拓扑数据分析和滑动窗口技术的人工文本边界检测

通过使用不同的方法和特征，我们提出了一种基于 RoBERTa 模型和冻结语言模型嵌入特征的新方法，能够超过人类准确度水平和先前考虑的基准，在真实或假文本基准测试上取得更好的结果，并且分析了各种设置下所有提出分类器的鲁棒性以及对人工文本边界检测算法性能的负面影响。

Nov, 2023

自适应文本区域表示的任意形状场景文本检测

提出了使用适应性文本区域表示的鲁棒场景文本检测方法，利用文本区域提案网络提取文本提案，再通过细化网络对提案进行验证和优化。实验结果在五个基准上表明，这种方法在场景文本检测方面达到了最先进水平。

May, 2019