Sep, 2011

深度架构图像跟踪中的注意力学习

TL;DR提出了一种基于注意力的模型,利用注视数据进行同时进行目标跟踪和识别。模型有两个相互作用的通路:身份和控制,分别模拟神经元科学模型中的「what 和 where」通路,其中前者使用深度(分解)受限玻尔兹曼机模拟对象外观并执行分类,而后者模拟关注对象的位置、方向、大小和速度,并估计状态的后验分布。