MMSep, 2021

PIMNet:一种用于场景文本识别的并行、迭代和模拟网络

TL;DR该研究提出了一种平行、迭代和模仿网络 (PIMNet),它采用了一种平行注意机制来更快地预测文本,以及一种迭代生成机制来使预测更加准确。与自回归模型相比,该方法在推理时间上更快,同时保持了很高的准确性。