Jun, 2022

GAMR: 一种深度引导关注模型用于 (视觉) 推理

TL;DR本文介绍了一个用于视觉推理的新模块 —— 带有引导注意力的视觉推理模型(GAMR),它通过选择和路由任务相关的视觉信息进入记忆的注意力移动序列来实现主动视觉理论。实验证明,GAMR 能够以稳健和高效的方式学习视觉任务,并能够在全新的推理任务上实现零 - shot 泛化。研究结果支持需要在注意力和记忆之间进行关键相互作用,以动态维护和操纵任务相关视觉信息来解决复杂视觉推理任务的认知理论。