深度架构图像跟踪中的注意力学习

Sep, 2011

深度架构图像跟踪中的注意力学习

Learning where to Attend with Deep Architectures for Image Tracking

Misha Denil, Loris Bazzani, Hugo Larochelle, Nando de Freitas

TL;DR提出了一种基于注意力的模型，利用注视数据进行同时进行目标跟踪和识别。模型有两个相互作用的通路：身份和控制，分别模拟神经元科学模型中的「what 和 where」通路，其中前者使用深度（分解）受限玻尔兹曼机模拟对象外观并执行分类，而后者模拟关注对象的位置、方向、大小和速度，并估计状态的后验分布。

Abstract

We discuss an attentional model for simultaneous object tracking and recognition that is driven by gaze data. Motivated by theories of perception

object tracking object recognition gaze data perception particle filtering

发现论文，激发创造

分层注意力循环跟踪

本文提出了一种基于分层注意力循环模型的目标跟踪算法，该算法可以在视频中跟踪单个物体，并通过梯度方法进行完全可微分且纯数据驱动的训练。为了改进训练收敛性，在损失函数中增加了与跟踪相关的辅助任务项。该模型在 KTH 活动识别数据集和 KITTI 物体跟踪数据集上进行了评估。

Jun, 2017

深度关注追踪：通过反馈学习实现

该研究论文提出了一种基于视觉注意力的训练深度分类器的互补学习算法，利用正反馈操作生成注意力图来作为正则化项，该机制能够使分类器学习到关注具有外观变化鲁棒性的目标对象的区域，实验证明该注意力跟踪方法在大规模基准数据集上的性能表现优于现有的基于检测的跟踪算法。

Oct, 2018

利用深度学习在中央凹区图像中学习搜索和检测物体

研究了利用仿生学注意机制的物体识别方法，通过采用集成注意力、分类和定位的双重任务模型，利用人类注意力系统分辨图像中的感兴趣区域。

Apr, 2023

视觉目标检测的注意力网络

基于注意力机制的深度神经网络在物体检测任务中的应用

Feb, 2017

学习视觉注意力生成模型

通过利用关注机制的生成学习框架，可以将图像中感兴趣的区域传递给生成建模的标准表征，并集中精力在感兴趣的对象上，从而建立新面孔的生成模型。

Dec, 2013

基于深度的人物识别的递归注意模型

本文提出了一种基于注意力机制的人体形状和运动动力学的识别模型，用于在没有 RGB 信息的情况下对人员身份进行识别。该模型利用独特的 4D 时空特征，采用卷积和循环神经网络相结合的形式，目标是识别代表人类身份的小的、具有区分性的区域。结果表明，该模型能够在多个公开数据集上产生当今最先进的结果。同时，本文还对该模型在视角、外貌和容积变化方面的鲁棒性进行了研究，并分享了该模型时空注意力的可解释的可视化结果。

Nov, 2016

面向隐私敏感环境的视线目标预测模块化多模态架构

本文提出了一种使用多模态线索，采用注意机制的模块化架构，以检测观察者线路中的障碍物并应用关注优先级，从而更好地实现识别和利用先验知识的方法，并在 GazeFollow 和 VideoAttentionTarget 公共数据集上展示了最先进的性能和隐私保护的竞争结果。

Jul, 2023

SpotNet: 自注意力多任务网络用于目标检测

本研究旨在通过多任务学习方式训练一个网络实现视觉注意力，使用半监督学习方式生成前 / 背景分割标签，进而训练目标检测模型，利用分割地图实现自我注意机制，获得在交通监控领域两个数据集上显著的 mAP 改进，UA-DETRAC 和 UAVDT 数据集上均实现了最先进的结果。

Feb, 2020

用于时空视觉注意的循环混合密度网络

本研究提出了一种基于高斯混合模型的时空注意力模型，并使用人类注视数据进行训练，相比先前的方法，该模型在影片显著性预测方面具有最先进的表现，并在动作分类准确性方面取得了改进。

Mar, 2016

视觉注意力下的多对象识别

提出使用基于注意力模型的深度循环神经网络，加上强化学习训练，以识别并定位输入图像中的多个目标。通过在谷歌街景图像中转录房屋编号序列的挑战性任务上的测试，表明该模型精度高于现有最先进的卷积神经网络，且使用的参数和计算量较少。

Dec, 2014