深度视觉注意力预测
DeepFix 是一种全新的卷积神经网络,可用于准确地预测显著性图,并集成了多尺度语义和全局上下文,并通过引入 Location Biased 卷积层来解决空间不变性问题,其表现优越。
Oct, 2015
该论文提出了一种基于卷积神经网络的方法,通过提取多尺度的高级视觉特征和上下文信息,结合全局场景信息,用于准确预测视觉显著性,可以适用于资源受限的应用,如(虚拟)机器人系统,从而在多个基准测试数据集上取得了有竞争力和一致的结果。
Feb, 2019
提出了一种基于卷积 LSTM 的新型模型,结合神经注意机制,可预测准确的显著图,并学习一组使用高斯函数生成的先验图,这种模型在公共显著性预测数据集上表现优于现有技术,可以克服人眼注视典型的中心偏差,并且对于不同的情境展现了关键组件各自的贡献。
Nov, 2016
本研究提出了一种基于高斯混合模型的时空注意力模型,并使用人类注视数据进行训练,相比先前的方法,该模型在影片显著性预测方面具有最先进的表现,并在动作分类准确性方面取得了改进。
Mar, 2016
本文提出了两种方法来模拟观察者在视觉搜索过程中的视觉注意力和干扰,第一种方法使用轻量级的自由视图显著性模型来预测人眼在搜索图像像素上的注视密度地图,第二种方法基于目标对象预测干扰器和目标。
Oct, 2022
本研究提出了一种新颖的深度架构用于显著性预测,通过整合卷积神经网络的不同层级的特征图、学习高低层级特征图的权重和使用先验学习网络来优化模型,使其在目前最大的公共数据集 SALICON 上表现优异且在 MIT300 基准测试中取得竞争性结果。
Sep, 2016
本研究采用深度卷积神经网络来提取多尺度特征,实现了高质量的图像显著性模型,另外还结合了手工特征,取得了很好的效果,提供了一个相应的实验数据集。
Sep, 2016
本文介绍了使用卷积神经网络进行图像视觉显著性建模的方法,采用新的神经网络结构和改进的空间相关性方法,同时使用多重分割提高了性能,实验表明我们提出的方法在公共基准测试中的表现优于目前已发表的最先进技术。
Mar, 2015
通过使用新的深度学习技术,本文旨在检测自然视频中的显著区域。首先预测视频帧中的显著补丁,然后基于它们构建预测的视觉注视地图。我们展示了通过更改优化网络参数的数据选择方式,可以将计算成本节约多达 12 倍。将 RGB 值的深度学习方法扩展到具有特定性的视频以利用人类视觉系统对残留运动的敏感性。在两个公开可用数据集上进行实验,并展示了较高的准确度和 AUC 度量。
Apr, 2016