DeepFix 是一种全新的卷积神经网络,可用于准确地预测显著性图,并集成了多尺度语义和全局上下文,并通过引入 Location Biased 卷积层来解决空间不变性问题,其表现优越。
Oct, 2015
提出了一种基于卷积 LSTM 的新型模型,结合神经注意机制,可预测准确的显著图,并学习一组使用高斯函数生成的先验图,这种模型在公共显著性预测数据集上表现优于现有技术,可以克服人眼注视典型的中心偏差,并且对于不同的情境展现了关键组件各自的贡献。
Nov, 2016
本研究提出一种基于 Bernoulli 分布的显著性图模型,并使用包括 softmax 在内的新损失函数,通过大规模数据和深度结构进行显著性估计,表现优于现有的显著性方法。
Apr, 2018
通过 Fisher pruning 方法和知识蒸馏的结合,我们获得了更高效的视觉显著性预测体系结构,为单幅图像凝视预测的加速在现实世界应用和视频显著性模型开发中具有重要意义。
Jan, 2018
探讨了利用机器学习技术进行眼部凝视估计的技术,论文中提出了在不受限制的场景下,通过使用眼部地标来预测凝视方向的方法,并讨论了采用合成数据进行眼部地标本地化训练的学习方法,并提出了使用该模型进行个性化凝视估计的方法。
Jul, 2022
本研究提出了一种基于高斯混合模型的时空注意力模型,并使用人类注视数据进行训练,相比先前的方法,该模型在影片显著性预测方面具有最先进的表现,并在动作分类准确性方面取得了改进。
Mar, 2016
研究了利用仿生学注意机制的物体识别方法,通过采用集成注意力、分类和定位的双重任务模型,利用人类注意力系统分辨图像中的感兴趣区域。
Apr, 2023
基于变压器模型的 Saliency TRansformer 方法通过利用变压器中的并行解码,仅从注视地图中学习显著性,并将显著性预测视为一种直接的集合预测问题,通过一种全局损失来预测唯一的注视点,并在 Salicon 和 MIT300 基准测试中取得与最先进方法相当的度量分数。
Nov, 2023
该研究提出了一种不需要注释的低维注视表示学习方法,在少于 100 个标注样本的情况下,实现了有竞争力的 few-shot 注视估计结果,并且可以应用于不同的实验数据集和注视网络预训练等方向。
Nov, 2019
本文介绍一种新颖的方法,通过重复使用深度神经网络的预训练模型,构建一种针对显著性预测的模型,从而有效地提高了预测准确性,并展示此网络结构可以为视觉注意机制的理解提供新的见解。
Nov, 2014