- 连接显著性预测与图像质量评估之间的差距
过去几年中,深度神经模型在图像质量评估 (IQA) 方面取得了显著进展,但由于深度神经网络的复杂性,其成功的原因仍不清楚。本文通过进行实证研究揭示了 IQA 和 Saliency Prediction 任务之间的关系,证明了前者包含了后者的 - 基于体积显著性引导的 RGB-D 室内场景分类图像摘要化
本研究提出了一种基于体积显著性引导的室内场景分类方法,结果表明该方法的有效性。
- 时间序列外部预测的一袋子感受域
高维时序数据的动态性、长度变化以及缺失值的存在带来了挑战,因此我们提出了 BORF 模型,它融合了时间序列卷积和 1D-SAX 的概念,以处理长度和缺失值变化的单变量和多变量时间序列。我们在完整的 UEA 和 UCR 存储库上评估了 BOR - 理解和建模任务与环境对驾驶员注视分配的影响
驾驶员注意力、注视预测、任务和环境、显著性和 DR (eye) VE 数据集是该研究的主要关键词和研究领域。
- ICML任务无关的可解释人工智能是否是一种神话?
本文提出了一个框架来统一解释人工智能(XAI)领域的挑战。尽管 XAI 方法可以为机器学习模型提供有用的输出,但研究人员和决策者需要注意这些方法的概念和技术限制,这些限制通常导致这些方法本身变成黑匣子。作者使用图像、文本和图形数据,研究了涉 - AAAI引导 Mixup:由显著图引导的高效 Mixup 策略
提出了一种新的基于 saliency-aware 的 mixup 方法 ——GuidedMixup,通过一种高效的配对算法来最小化配对图像的显著区域间的冲突,平滑地插值两幅图像以更好地保留显著区域,并且可以在分类数据集上提供良好的计算效率与 - ViDaS 视频深度感知显著性网络
本文介绍了一种称为 ViDaS 的全卷积双流深度感知显著性网络,使用 RGB 和深度流作为输入,利用编码器 - 解码器模型获得显著性图来预测人类在 “野外” 环境中的注意力,经过在多个不同数据库中的测试和评估,该方法在大多数情况下优于现有的 - ICLRN2G: 一种可扩展的方法,用于量化大型语言模型中的可解释神经元表示
N2G 提供了一种 less labour intensive 的方式来解释语言模型中的神经元,同时适用于 Large Language Models(LLMs),通过转化神经元的行为为可解释的图表来帮助研究人员对模型的内部机制进行研究。
- 使用眼动跟踪、标注和语言模型进行文本风格显著性比较研究
本文介绍了一个用于人类对文学文本 (例如礼貌) 处理的眼动数据集 eyeStyliency, 并使用各种方法推导出收集的眼动数据中的样式显着性得分,研究人员探讨了眼动数据与人类注释和基于模型的重要性评分的关系,并发现引人注目的单词添加到提示 - 为何这个模型预测了这个未来?:封闭形式的时间显著性推动概率预测的因果解释
本研究提出了一种基于信息论的新方法,通过计算观察窗口的不同熵值,识别概率预测模型中影响预测的显著观察窗口,并用合成会话数据集中的话语转换预测任务来证明了该框架的实用性 。
- CLIP-It!基于语言指导的视频摘要
CLIP-It 是一种单一框架用于通用和基于查询的视频摘要,使用语言指导的多模式变压器来学习评分视频中的帧,并可以扩展到无监督环境。 在标准的视频摘要数据集和基于查询的视频摘要数据集上均表现出显著的优异性能。
- ACL句子处理中的相对重要性
本文比较了人类和神经语言模型中的相对重要性模式,发现人类语言处理的模式与基于显著性的神经语言模型的相对重要性高度相关,同时表明显著性可能是解释神经语言模型的认知更可信的度量标准。
- 关于可证实解释性研究的探索
本文介绍了深度神经网络的可解释性研究及其方法,指出目前的方法存在的局限和风险,并提出了以可证伪性为核心的新的研究框架,目的是为了产生更具意义和可靠的可解释性方法。
- 基于显著性驱动的感知图像压缩
本文提出了一种新的端到端可训练模型,用于有损图像压缩。该方法包括几个新颖的组件,其中包括充分的感知相似度度量、图像中的显着性和分层自回归模型。该模型不仅生成视觉效果更好的图像,而且在后续计算机视觉任务(如目标检测和分割)中也具有优越的性能。
- 基于伪反馈蒸馏的无监督双级联学习用于基于查询的抽取式摘要
本文提出一种新的无监督、查询聚焦、多文档提取式摘要器 Dual-CES,采用基于显著性和焦点的双级双级联优化方法,以及基于显著性的伪反馈提取,其综合性能明显优于其他最先进的无监督提取式摘要器,并且甚至能够胜过强有力的监督式摘要器。
- 稀缺训练数据情境下细粒度物体识别的显著性
本文研究利用显著性在很少的训练数据时提高卷积神经网络的分类准确性。我们利用在现有 CNN 架构中添加显著性分支来引导特征提取过程,从而训练出一个具有高水平的对象识别精度的模型。我们的实验表明,显著性方法可以显著提高网络性能,特别是在很少的训 - ICML行动之前起身:利用人类的视觉注意力进行持续学习
本文介绍了在 DeepMind Lab 的三维迷宫中,通过训练代理使用原始图像以及与基于实时谱残差技术生成的显著性地图相叠加的凝视图像,探索利用人类注意力聚焦来进行决策的有效性,并研究了在环境噪声下的迁移学习表现。
- CVPRRNN 的激活反向传播
本研究提出了一种基于深度模型的视频内容分析方法,同时利用自顶向下的显著地图来将证据同时固定在空间和时间上,并通过模型内部表示可视化出影响深度模型输出的时空线索,进而能够在视频段中定位特定动作或字幕短语所对应的特征。
- OpenSalicon: Salicon 显著性模型的开源实现
本文介绍了 SALICON 显着性模型的公共实现。该模型是 MIT 300 注视点预测数据集中表现最优秀的模型之一,支持训练和测试,并且提供预训练模型和代码,方便用户使用。