MMNov, 2021

利用资源丰富的语言数据集进行资源匮乏语言的端到端场景文本识别

TL;DR本文介绍了一种用于端到端场景文本识别的训练方法,该方法利用多语言数据集进行编码器的预训练,将编码器上的知识泛化到目标语言;同时,使用目标语言的数据集训练解码器以提高模型在目标语言数据上的表现。实验表明,该方法在小规模数据集上具有较好的识别效果。