AAAIMay, 2020

SPIN: 结构保持内部偏移网络用于场景文本识别

TL;DR本研究介绍了一种可学习的几何无关模块 ——SPIN,该模块允许神经网络主动变换输入强度颜色,以解决场景文字识别任务中的色彩困难问题,并与现有的空间变换模块协同工作,实验结果表明,使用 SPIN 可以显著提高多个文本识别基准的性能。