Feb, 2021

可扩展的图像分类的硬注意力

TL;DR提出 TNet,一种多尺度硬注意力结构,通过自上而下的方式遍历图像尺度空间,只访问最具信息性的图像区域,神经网络可以更快地处理高分辨率图像,在 ImageNet 和 fMoW 数据集上都获得了更高的准确性。