- 超越感知之门:视觉转换器表示对象之间关系
视觉变换器(ViTs)在各种情境下取得了最先进的性能,但在涉及视觉关系的任务中却展现出惊人的失误。本文从机械性可解释性的角度研究了 ViTs 用于执行抽象视觉推理的高层视觉算法,并通过一个关系推理任务的案例研究,发现 ViTs 通常表现出两 - 抽象视觉推理模型中的泛化和知识迁移
研究在抽象视觉推理领域中,深度神经网络的泛化和知识重用能力,通过使用 Raven's Progressive Matrices(RPMs)作为评估抽象视觉推理能力的基准任务。通过研究两种知识转移场景,介绍了 Attributeless-I- - 抽象视觉推理问题的统一视角
我们提出了一种统一的抽象视觉推理任务表示方法,可以应用于不同类型的任务,并且能够在迁移学习和课程学习中有效地重用知识。
- 人类与多模态 LLMs 之间的视觉认知差距是什么?
我们提出了一个新数据集 MaRs-VQA 和一个新的基准 VCog-Bench,以评估 Multimodal Large Language Models 的零射击 Abstract Visual Reasoning 能力,并将其与现有的人类 - MARVEL: 多维度的可视化评估和学习中的抽象和推理
多模态大型语言模型在抽象视觉推理方面呈现出近乎随机的性能,无法理解视觉特征和难以进行抽象推理。
- 槽位抽象器:朝着可扩展的抽象视觉推理
通过结合不同方法的优势,提出了一种可扩展到包含大量对象和多个关系的问题的抽象可视化推理方法,在四个抽象可视化推理任务中展示了最先进的性能。
- AAAI重新审视解开下游任务中的必要性:对抽象视觉推理的研究
研究表明,对于下游任务而言,维度上解耦表示是不必要的,而表示的信息性比解耦性更好地预示了下游任务的性能。
- AAAI一个可自配置的模型来解决多个抽象视觉推理问题
提出了一个统一的模型 SCAR 用于解决单选抽象视觉推理任务,该模型利用新颖的 SAL 结构自适应权重来解决各种类型的 AVR 任务,并在多任务和迁移学习中展示了有效的知识重用,为 AVR 领域的任务无关研究路径的进展提供了刺激和促进。
- 解决 Raven 进阶矩阵问题的概念变化规则的抽象化
提出了一种深度潜变量模型来学习可解释的概念,并在该过程中分析潜在空间中的概念转换规则,自动抽象出数据集上共享的全局规则,并实现抽象位置上的答案生成任务。
- 学习可微分逻辑程序以进行抽象视觉推理
提出了基于神经 - 符号融合的可微转移学习推理机制,命名为 NEUMANN,并通过推理识别复杂的可视化场景,包括因果推理和抽象概念推理。
- ICLR学习如何在视觉对象上进行推理
探究对象为中心的编码器和变换推理模块是否能提高图像推理任务的效果,并发现其比传统以 Raven 智力测试为基础的任务特定归纳偏见更全面适用。
- 抽象视觉推理研究的新兴方向综述
本论文回顾了近年来浮现出的抽象视觉推理问题的研究,并提出了一个分类体系来归纳这些问题的性质。通过研究这些问题在输入形状、隐藏规则、目标任务、认知功能和主要挑战等五个纬度上的共性和差异,一方面对于解决 Abstract Visual Reas - 抽象视觉推理的深度学习方法:关于瑞文渐进矩阵的调查
本文总结了近年来深度学习方法在抽象视觉推理领域的应用研究进展,并重点关注了目前最普遍的抽象视觉推理任务 —— 瑞文渐进矩阵(RPM),并提供了综合的深度神经模型和学习方法以及 RPM 基准集的分析,对现有方法的性能进行了分析,为当前和未来研