Jun, 2018

NRTR:一种无循环的序列到序列模型,用于场景文本识别

TL;DR本文提出了一种新的无循环序列到序列文本识别器(NRTR),并采用自注意力机制代替基于循环或卷积的网络,使用模态转换块将 2D 输入图像有效转化为 1D 序列以提取更判别性的特征,这使得 NRTR 在常规和非常规基准测试上均取得了最新的或者竞争性的性能,并相较于目前最佳的模型少至少 8 倍的训练时间。