Dec, 2023

深度学习时代的凝视

TL;DR本文介绍了一种使用视锥传感器主动关注视觉场景的方法,并提出了一种端到端可区分的视锥主动视觉架构,该架构利用图卷积网络处理视锥图像,并提供一种简单而有效的视锥图像采样形式。我们的模型通过学习迭代地关注与分类相关的图像区域。我们在多个图像数据集上进行了详细实验,比较了我们的方法与先前的视锥视觉方法的性能,同时还测量了不同选择(如视锥程度和网络执行的固定点数)对目标识别性能的影响。我们发现,我们的模型在具有可比参数和给定像素或计算预算的最先进 CNN 和视锥视觉架构上表现更好。