通过边界变换进行任意形状文本检测
该论文提出了一个基于端到端文本检测的点定位方法,通过定位文本边界上的一组点,建立了一种简单而有效的方案,可读取任意形状的文本,并在 ICDAR2015,TotalText 和 COCO-Text 三个数据集上展开实验,实验结果表明,该方法在场景文本检测和端到端文本识别任务上均超过了现有技术水平。
Nov, 2019
通过渐进式轮廓回归及轮廓变换器,我们提出了一种名为 CT-Net 的新型任意形状场景文本检测框架,以解决前端轮廓初始化不准确、多阶段误差累积或局部信息聚合不足的限制,并通过大量实验验证了其在准确性和效率方面超越了现有方法。
Jul, 2023
本文提出了一种名为 Text Perceptron 的端到端可训练文本检测方法,利用基于分割的高效检测器和新颖的形状变换模块,实现了文本检测和识别部分的全局优化,取得了在多个基准测试数据集上的优异性能表现。
Feb, 2020
本论文提出了一种基于 transformer 的简单但极其有效的场景文本识别方法,只需要空间注意力而不需要矫正图像,仅使用卷积特征图作为单词嵌入输入到 transformer 中,并在大规模实验中取得了显著的优越性能。
Mar, 2020
该研究提出了一种名为 TextRay 的任意形状文本检测方法,采用一次性无锚点框架中的自顶向下轮廓基准几何建模和几何参数学习,能够将复杂的几何布局编码为统一的表示,并输出仅经过一个 NMS 后处理的简单多边形检测。
Aug, 2020
本文提出了一种新颖的边界点动态优化(BPDO)的任意形状场景文本检测器,该模型通过基于分割的文本感知模块(TAM)和边界点动态优化模块(DOM)实现。实验证明,该模型在 CTW-1500、Total-Text 和 MSRA-TD500 数据集上的性能优于或可与最先进算法相媲美,证明了该模型的有效性。
Jan, 2024
通过使用不同的方法和特征,我们提出了一种基于 RoBERTa 模型和冻结语言模型嵌入特征的新方法,能够超过人类准确度水平和先前考虑的基准,在真实或假文本基准测试上取得更好的结果,并且分析了各种设置下所有提出分类器的鲁棒性以及对人工文本边界检测算法性能的负面影响。
Nov, 2023
提出了使用适应性文本区域表示的鲁棒场景文本检测方法,利用文本区域提案网络提取文本提案,再通过细化网络对提案进行验证和优化。实验结果在五个基准上表明,这种方法在场景文本检测方面达到了最先进水平。
May, 2019