ECCVJul, 2022

使用置换自回归序列模型的场景文本识别

TL;DRPARSeq 使用 Permutation Language Modeling 学习了一组共享权重的内部 AR 语言模型的集合,实现了无上下文的非 AR 和有上下文的 AR 推理以及使用双向上下文的迭代细化,使用注意力机制进行文本识别,取得了在 STR 基准测试中的最新成果,并在一些具有挑战性的数据集上建立了新的 SOTA 结果。