Aug, 2023

用于文本识别的自训练正则化连接主义时序分类损失:一种简单而有效的方法

TL;DR提出了一种自我蒸馏方案来优化基于 CTC 的文本识别模型的损失函数,该方案通过引入 CTC 损失中的帧正则化项来强调个体监督,并利用最大后验概率来解决蒸馏过程中的一致性问题,称之为 Distillation Connectionist Temporal Classification (DCTC) 损失。在公共基准测试中的大量实验证明,DCTC 可以在没有任何副作用的情况下将文本识别模型的准确性提高 2.6%。