Feb, 2022

使用多任务变压器实现弱监督文本识别

TL;DR介绍一种基于 transformer 的文本定位方法 TextTranSpotter (TTS),该方法可以在全监督和弱监督的情况下训练,并使用基于 Hungarian loss 的新型损失函数,不需要昂贵的本地化注释,通过每个单词检测学习单一潜在表示,实现了与先前最先进的全监督方法相当的性能。