Mar, 2024
槽位抽象器:朝着可扩展的抽象视觉推理
Slot Abstractors: Toward Scalable Abstract Visual Reasoning
Shanka Subhra Mondal, Jonathan D. Cohen, Taylor W. Webb
TL;DR通过结合不同方法的优势,提出了一种可扩展到包含大量对象和多个关系的问题的抽象可视化推理方法,在四个抽象可视化推理任务中展示了最先进的性能。
Abstract
abstract visual reasoning is a characteristically human ability, allowing the
identification of relational patterns that are abstracted away from object
features, and the →
abstract visual reasoningrelational patternssystematic generalizationslot-based methodsmulti-object visual inputs
发现论文,激发创造
物体为中心的关系抽象的系统性视觉推理
该研究描述了 Object-Centric Relational Abstraction(OCRA) 模型,其结合了具有抽象表征能力的目标提取和针对关系的归纳偏差,能够从图像输入中提取显式的对象和抽象关系,实现了关于复杂视觉展示的强系统化概括。
Jun, 2023
尺度局部化的抽象推理
该研究提出了一种多尺度架构,用于处理抽象关系推理任务中的空间和语义关系,其优于现有技术在所有基准测试中的成功表明来自多种创新,包括:在多个解析度中搜索关系模式,优化每个分辨率的推理网络并构建一个新的 RAVEN-FAIR 数据集。
Sep, 2020
对象为中心的表示、引导注意力和外部记忆对视觉关系泛化的作用
本研究系统评估了深度神经网络(DNN)在视觉推理任务中的应用,发现虽然某些模型表现出在某些特定类型的图像上函数良好,但没有一个模型能够有效地推广到所有情况下,从而得出抽象视觉推理仍然是 DNN 面临的主要挑战。
Apr, 2023
视觉抽象推理任务的深度非单调推理
本文提出了一种非单调计算方法来解决视觉抽象推理任务,使用 RAVEN 数据集进行测试,并与现有单调深度学习模型进行比较,结果表明,该方法比现有单调深度学习模型更加有效。
Feb, 2023
RelViT: 用于视觉关系推理的概念引导视觉 Transformer
本文利用视觉转换器 (ViTs) 作为我们视觉推理的基本模型,通过优化定义为物体实体及其关系概念,推动 ViTs 的推理能力,并介绍了一种新的概念特征字典,以促进全局关系推理和促进语义对象特定一一对应关系学习的局部任务。结果显示,我们的模型 Concept-guided Vision Transformer(或 RelViT)在 HICO 和 GQA 上的性能均优于先前的方法,并充分考虑了 ViT 变体和超参数的稳健性。
Apr, 2022
Abstractors: 符号消息传递和关系推理的 Transformer 模块
该论文提出了一个框架,它将关系学习转化为变形器,借助关系交叉注意机制实现感觉状态和抽象状态之间的绑定。
Apr, 2023