提出了一种基于条件生成模型的解答生成方法,通过使用潜在空间中的规则抽象和选择(RAISE)来编码图像属性、分解潜在规则,并在生成答案时选择适当的原子规则,以解决 Raven's Progressive Matrix(RPM)中的抽象视觉推理问题。RAISE 在生成底部右侧和任意位置的答案任务中优于其他生成求解器,并通过奇异法找到违反潜在规则的图像,处理具有未见规则和属性组合的 RPM。
Jan, 2024
本文提出了一种分层规则感知网络(SRAN),以解决图形推理测试 RPM 中的互补偏差问题,并引入了用于创建改进数据集 I-RAVEN 的答案集生成算法
Feb, 2020
基于变压器蓝图的深度学习架构,解决抽象推理任务中的挑战,通过预测个体对象及其布局的视觉属性来选择答案,并在实验评估中优于现有方法,提供关于推理的有趣见解和部分解释,同时免疫某些 RPM 基准中已知的偏见。
Aug, 2023
探究对象为中心的编码器和变换推理模块是否能提高图像推理任务的效果,并发现其比传统以 Raven 智力测试为基础的任务特定归纳偏见更全面适用。
Mar, 2023
介绍一种新的代数机器推理框架,将 Raven 渐进矩阵问题求解转化为代数计算,利用理想的 Gröbner 基计算等数学算法,能够从答案集合中选出正确答案并仅凭问题矩阵就生成正确答案,试验在 I-RAVEN 数据集上达到 93.2% 的准确率,超过当前最先进的 77.0% 和人类表现的 84.4% 准确率。
本文总结了近年来深度学习方法在抽象视觉推理领域的应用研究进展,并重点关注了目前最普遍的抽象视觉推理任务 —— 瑞文渐进矩阵(RPM),并提供了综合的深度神经模型和学习方法以及 RPM 基准集的分析,对现有方法的性能进行了分析,为当前和未来研究的趋势提供了见解和意见,并最终展示了实际问题如何受益于 RPM 研究的发现。
Jan, 2022
学习向量符号体系在解决抽象推理问题 (Raven's progressive matrices) 方面具有高效性和预测准确性。
提出了基于 Contrastive Perceptual Inference network (CoPiNet) 的 Vision Transformer Contrastive Network, 结合心理学、认知学和教育学,采用先进的 Vision Transformer 架构,从像素级输入和全局特征上进一步改进了机器处理和推理空间 - 时间信息在 RAVEN 数据集上的能力。
Mar, 2024
本文介绍使用类比和图像转换的计算模型解决 Raven 渐进矩阵测试问题,并证明了使用这些方法在标准版本中可以解决 57 个问题中的 60 个问题。
Aug, 2022
通过使用神经网络来解决 “渐进矩阵” 谜题,本研究旨在提高机器的抽象推理能力。我们提出了一种简单而有效的双重对比网络(DCNet)来利用谜题的固有结构。实验结果表明,DCNet 在性能上优于最先进的方法。
May, 2022