- 扫视路径模型中设计决策的影响
模拟视觉显著性在图形用户界面(GUI)中,有助于理解人们如何感知 GUI 设计以及吸引他们注意力的元素。我们系统地分析了不同设计参数对扫描路径评估指标的影响,使用了最先进的计算模型(DeepGaze++)。我们特别关注三个设计参数:输入图像 - ViSaRL:人眼显著性引导的视觉强化学习
用基于视觉显著性引导的强化学习(ViSaRL)来训练机器人从高维像素输入中执行复杂的控制任务,通过优化视觉表征,ViSaRL 显著提高了强化学习代理在不同任务上的成功率、样本效率和泛化能力。
- 基于显著性的人脸反欺诈视频摘要
通过提取视觉显著性信息,利用基于加权融合的视频摘要方法改进人脸防伪识别模型的性能和效率,以面向数据的方式提供一种有效的训练集,通过 CNN-RNN 架构在五个具有挑战性的人脸防伪数据集上取得了最先进的表现。
- 高级驾驶辅助系统中的视觉显著性检测
我们提出了一种结合司机困倦检测系统和基于显著性的场景理解流水线的智能系统,该系统在嵌入式平台上运行,并利用专用 3D 深度网络进行语义分割。我们还使用车辆方向盘上嵌入的创新生物传感器来监测驾驶员的困倦程度,并对收集到的驾驶员脉搏波信号进行分 - 可解释人脸识别的判别性深度特征可视化
本文提出了一种基于面部重建和视觉显著性的解释深度人脸识别决策的方法,通过产生表达输入面部相似和不相似区域的视觉显著性图,提供了有洞察力的解释, 在实验证明所提出方法的有效性。
- CVPR学习像素级别的视频精华检测
本文提出了一种基于像素级别特征的视频亮点检测方法,通过学习每个像素在视频中的所属类别,既考虑了时间序列特征,也考虑了空间特征;并且通过使用 3D 卷积神经网络和视觉显著性模型,构建了一个编码 - 解码网络,在三个公共基准测试集上均取得了最先 - ICCVMAAD: 面向驾驶中 “关注感知” 的模型和数据集
提出了一种计算模型估计人们对所处环境的注意意识,测试了该模型在驾驶场景中的效果,结果表明该模型能够合理地估计被关注的意识区域,并在视觉显著性、凝视校准和去噪等任务中表现出较好的效果。
- ICCV因果关注用于无偏视觉识别
本文提出了一种因果关系注意力模块,通过自我注释来识别难以预测的混淆变量,从而使深度学习模型更好地处理在分布不同的情况下仍具备鲁棒性的因果特征,不仅解决了监督注释需要高昂成本、混淆变量难以抽象提取等问题,并在相应实验中得到了卓越的结果。
- 基于显著性的防御对抗样本的方法(SAD)
本研究提出了一种基于视觉显著性的方法,用于清理受对抗性攻击影响的数据。该模型利用对抗性图像的显著区域提供有针对性的对策,并在相对减少清理后图像的损失的同时,通过评估各种指标的准确性来证明它的有效性。
- ICCV图像字幕中的人类注意力:数据集和分析
研究通过使用新的包含视觉图像和口头描述的数据集,比较了人类在自由观看和图像描述任务中的注意力差异以及注意力部署机制,并分析了软注意机制与人类注意力之间的相似性。最终表明人类注意力与当前的软注意机制仍存在较大差距,并且将软注意机制与视觉显著性 - 基于上下文编码器 - 解码器网络的视觉显著性预测
该论文提出了一种基于卷积神经网络的方法,通过提取多尺度的高级视觉特征和上下文信息,结合全局场景信息,用于准确预测视觉显著性,可以适用于资源受限的应用,如(虚拟)机器人系统,从而在多个基准测试数据集上取得了有竞争力和一致的结果。
- MM中心突出的视觉显著性和基于对比度的全参考图像质量指标
本文提出了一种基于视觉显著性和对比度的全参考图像质量评估方法,该方法增加了中心区域的敏感度,通过在三个大规模的基准数据库上的实验验证,显示出与人类评估数值更强的相关性和更高的实时处理速度,并提供 MATLAB 代码以供测试。
- ECCV逼真图像合成用于准确识别场景中的文本
通过语义一致性合成、视觉显著性确定和自适应文本外观模型等三个创新设计,提出了一种新的图像合成技术,用于生成大量标注数据,以用于训练准确和稳健的场景文本检测和识别模型。五个公共数据集的实验证明了该技术在训练精确和稳健的场景文本检测和识别模型方 - SalientDSO: 引入注意力机制的直接稀疏里程计
本文介绍了一种在直接稀疏视觉里结合使用视觉显著性和场景分析新方法,命名为 SalientDSO,并通过 CVL-UMD 数据集进行了定量和定性比较,超越了 DSO 和 ORB-SLAM 这两种最先进的方法。这是首次使用视觉显著性和场景分析来 - 基于语义的 360 度视频超时速漫游生成
本文提出了一种将全景视频转换为普通视野追踪摄影以实现最佳观看体验的系统,在利用视觉显著性和语义来非均匀取样以生成追踪摄影 的同时,用户还可以选择自定义感兴趣的物体。通过比较现有技术的研究结果,我们验证该系统的有效性。
- CVPR基于标题引导的自上而下视觉显著性
本文提出了基于标题引导的视觉显著性方法,通过训练数据隐式的学习到现代编码器解码器网络中的区域到单词的映射,而不引入显式的注意力层,从而分析各种现有模型结构,并提供更准确的显著性热图。
- AAAI当显著性遇见情感:理解图像如何引发情绪和情感
本文探讨图像情感分析中视觉显著性与情感之间的微妙而全面的相互作用,并使用现有技术对图像进行分析,试图阐明显著区域的情感如何影响图像的整体情感,研究结果表明了显著性与情感之间的相关性,并为可视化情感唤起机制提供了新颖的见解。
- 基于多尺度深度 CNN 特征的视觉显著性检测
本研究采用深度卷积神经网络来提取多尺度特征,实现了高质量的图像显著性模型,另外还结合了手工特征,取得了很好的效果,提供了一个相应的实验数据集。
- 基于频域尺度空间分析的视觉显著性
通过使用频域分析问题解决方法、引入非显著性概念、并同时考虑不同尺寸的显著性区域检测,提出了一种新的自下而上的视觉显著性检测方法,使用幅度谱与低通高斯核卷积产生显著性图,并通过熵最小化获取合适的尺度,实验结果表明该方法可预测人眼注视数据。
- CVPR基于多尺度深度特征的视觉显著性
本文介绍了使用卷积神经网络进行图像视觉显著性建模的方法,采用新的神经网络结构和改进的空间相关性方法,同时使用多重分割提高了性能,实验表明我们提出的方法在公共基准测试中的表现优于目前已发表的最先进技术。