Jan, 2022

动态视觉识别的快速扫描和精确定位网络

TL;DR本文提出了一个新的序列特征学习方法,Glance and Focus Network(GFNet),用于图像识别问题中的减少空间冗余和时间复杂度的优化,GFNet 采用类似人类视觉系统的粗到细的学习方式处理图像,并通过强化学习的方式定位图像中的显著区域,从而避免了手动标注的需求。实验表明,GFNet 能够大幅度降低 MobileNet-V3 在 iPhone XS Max 上的平均延迟 (1.3x),而精度没有任何损失。