MSR: 多尺度形状回归在场景文本检测中的应用
本文提出了一种名为 SLPR 的新方法,用于在自然场景中检测任意形状的文本,可以适应许多目标检测体系结构,并在传统的 ICDAR2015 偶然场景文本基准和曲线文本检测数据集 CTW1500 上取得了竞争性的结果。
Jan, 2018
提出了使用适应性文本区域表示的鲁棒场景文本检测方法,利用文本区域提案网络提取文本提案,再通过细化网络对提案进行验证和优化。实验结果在五个基准上表明,这种方法在场景文本检测方面达到了最先进水平。
May, 2019
提出了一种名为 LRANet 的文本检测器,该方法基于双重匹配方案用于正样本,利用低秩近似的文本轮廓表示方法来处理不规则形状文本,提高速度与准确性,并在三个数据集上展示了该方法的比较优越性。
Jun, 2023
本文提出一种基于对称约束的矫正网络(ScRN),利用文本实例的局部属性(如中心线、比例和方向)来生成更好的校正结果,从而实现对正常和不规则形状文本的高识别精度。该方法在包含相当比例的不规则文本实例的数据集(例如 ICDAR 2015、SVT-Perspective 和 CUTE80)上,优于现有算法。
Aug, 2019
该论文提出了一种利用文本边框的角点定位和定位相对位置的文本区域分割方法,结合了一般性物体检测和文本区域分割的优点,避免了它们的缺点,并在 ICDAR2013,ICDAR2015,MSRA-TD500,MLT 和 COCO-Text 上进行了实验,得出了比以前更好或相当的结果。
Feb, 2018
该论文提出了一种能够有效表示包括水平的,有方向的和有曲率的文本实例的文本表示方法 TextSnake,并使用基于 TextSnake 的文本检测器,在多个数据集上取得了最先进的性能表现,特别是在曲线文本上。
Jul, 2018
本文提出了一种名为旋转敏感回归检测器(RRD)的方法,旨在解决多方向文本探测器中存在的分类问题和面向文本方向的定位问题不相容的问题。该方法通过两个不同设计的网络分支提取具有不同特征的特征,具体地,通过旋转卷积过滤器提取旋转敏感特征的回归分支,通过池化旋转敏感特征提取旋转不变特征的分类分支。该方法在三个面向文本基准数据集上实现了最先进的性能,包括 ICDAR 2015、MSRA-TD500、RCTW-17 和 COCO-Text。并且在船舶收集数据集上对定位面向对象也取得了显著的进展,显示了该方法在面向对象检测方面的普适性。
Mar, 2018
本文提出了一种准确和鲁棒性较高的文本检测方法,通过设计快速有效的剪枝算法,使用最小化正则化变化策略来提取极值区域,然后通过单链接聚类算法将字符候选分组为文本候选,在使用一种自学习距离度量算法自动学习距离权重和聚类算法的阈值来识别文本候选,并使用字符分类器估计相应的文本候选的后验概率来消除具有高概率的非文本文本候选,并最终识别出文本。通过实验结果证明,该方法的检测效果优于其他竞争方法。
Jan, 2013
本研究提出了一种简单而强大的场景文本检测流程,该流程可以直接预测全图中任意方向和四边形形状的单词或文本行,消除了不必要的中间步骤(例如候选聚合和单词划分),只需要一个神经网络进行操作,大大提升了检测的准确性和效率。
Apr, 2017