Jan, 2022
动态视觉识别的快速扫描和精确定位网络
Glance and Focus Networks for Dynamic Visual Recognition
TL;DR本文提出了一个新的序列特征学习方法,Glance and Focus Network(GFNet),用于图像识别问题中的减少空间冗余和时间复杂度的优化,GFNet采用类似人类视觉系统的粗到细的学习方式处理图像,并通过强化学习的方式定位图像中的显著区域,从而避免了手动标注的需求。实验表明,GFNet能够大幅度降低MobileNet-V3在iPhone XS Max上的平均延迟 (1.3x),而精度没有任何损失。