RAVEN: 用于关系和类比视觉推理的数据集

CVPRMar, 2019

RAVEN: 用于关系和类比视觉推理的数据集

RAVEN: A Dataset for Relational and Analogical Visual rEasoNing

Chi Zhang, Feng Gao, Baoxiong Jia, Yixin Zhu, Song-Chun Zhu

TL;DR本研究提出了一个新的数据集，旨在通过在分层表示中将视觉与结构、关系和类比推理相匹配，提高机器智能水平，并通过加入神经模块组合视觉理解和结构推理，持续改进所有模型的性能，实现现代视觉与机器推理的结合。

Abstract

Dramatic progress has been witnessed in basic vision tasks involving low-level perception, such as object recognition, detection, and tracking. Unfortunately, there is still an enormous performance gap between artificial vision systems and human intelligence in terms of higher-level vision problems, especially ones involving →

computer vision reasoning raven's progressive matrices neural module visual understanding

发现论文，激发创造

ViTCN：用于推理的视觉转换器对比网络

提出了基于 Contrastive Perceptual Inference network (CoPiNet) 的 Vision Transformer Contrastive Network，结合心理学、认知学和教育学，采用先进的 Vision Transformer 架构，从像素级输入和全局特征上进一步改进了机器处理和推理空间 - 时间信息在 RAVEN 数据集上的能力。

Mar, 2024

抽象视觉推理的深度学习方法：关于瑞文渐进矩阵的调查

本文总结了近年来深度学习方法在抽象视觉推理领域的应用研究进展，并重点关注了目前最普遍的抽象视觉推理任务 —— 瑞文渐进矩阵（RPM），并提供了综合的深度神经模型和学习方法以及 RPM 基准集的分析，对现有方法的性能进行了分析，为当前和未来研究的趋势提供了见解和意见，并最终展示了实际问题如何受益于 RPM 研究的发现。

Jan, 2022

学习如何在视觉对象上进行推理

探究对象为中心的编码器和变换推理模块是否能提高图像推理任务的效果，并发现其比传统以 Raven 智力测试为基础的任务特定归纳偏见更全面适用。

Mar, 2023

抽象视觉推理模型中的泛化和知识迁移

研究在抽象视觉推理领域中，深度神经网络的泛化和知识重用能力，通过使用 Raven's Progressive Matrices（RPMs）作为评估抽象视觉推理能力的基准任务。通过研究两种知识转移场景，介绍了 Attributeless-I-RAVEN 和 I-RAVEN-Mesh 两个数据集，以及一种名为 PoNG 的新型神经架构，用于解决抽象视觉推理任务。

Jun, 2024

抽象视觉推理：一种代数方法用于解决 Raven 渐进矩阵问题

介绍一种新的代数机器推理框架，将 Raven 渐进矩阵问题求解转化为代数计算，利用理想的 Gröbner 基计算等数学算法，能够从答案集合中选出正确答案并仅凭问题矩阵就生成正确答案，试验在 I-RAVEN 数据集上达到 93.2% 的准确率，超过当前最先进的 77.0% 和人类表现的 84.4% 准确率。

Mar, 2023

矢量符号化架构中基于学习规则的视觉抽象推理的概率推断

学习向量符号体系在解决抽象推理问题 (Raven's progressive matrices) 方面具有高效性和预测准确性。

Jan, 2024

通过任务分解学习抽象视觉推理：Raven 渐进矩阵的案例研究

基于变压器蓝图的深度学习架构，解决抽象推理任务中的挑战，通过预测个体对象及其布局的视觉属性来选择答案，并在实验评估中优于现有方法，提供关于推理的有趣见解和部分解释，同时免疫某些 RPM 基准中已知的偏见。

Aug, 2023

抽象视觉推理的分层规则感知网络

本文提出了一种分层规则感知网络（SRAN），以解决图形推理测试 RPM 中的互补偏差问题，并引入了用于创建改进数据集 I-RAVEN 的答案集生成算法

Feb, 2020

几何矩阵推理任务中基于视觉想象力的类比构建

本文介绍使用类比和图像转换的计算模型解决 Raven 渐进矩阵测试问题，并证明了使用这些方法在标准版本中可以解决 57 个问题中的 60 个问题。

Aug, 2022

迈向生成式抽象推理：通过规则抽象和选择完成 Raven's Progressive Matrix

提出了一种基于条件生成模型的解答生成方法，通过使用潜在空间中的规则抽象和选择（RAISE）来编码图像属性、分解潜在规则，并在生成答案时选择适当的原子规则，以解决 Raven's Progressive Matrix（RPM）中的抽象视觉推理问题。RAISE 在生成底部右侧和任意位置的答案任务中优于其他生成求解器，并通过奇异法找到违反潜在规则的图像，处理具有未见规则和属性组合的 RPM。

Jan, 2024