抽象视觉推理的分层规则感知网络
提出了一种基于条件生成模型的解答生成方法,通过使用潜在空间中的规则抽象和选择(RAISE)来编码图像属性、分解潜在规则,并在生成答案时选择适当的原子规则,以解决 Raven's Progressive Matrix(RPM)中的抽象视觉推理问题。RAISE 在生成底部右侧和任意位置的答案任务中优于其他生成求解器,并通过奇异法找到违反潜在规则的图像,处理具有未见规则和属性组合的 RPM。
Jan, 2024
提出了一种深度潜变量模型来学习可解释的概念,并在该过程中分析潜在空间中的概念转换规则,自动抽象出数据集上共享的全局规则,并实现抽象位置上的答案生成任务。
Jul, 2023
研究在抽象视觉推理领域中,深度神经网络的泛化和知识重用能力,通过使用 Raven's Progressive Matrices(RPMs)作为评估抽象视觉推理能力的基准任务。通过研究两种知识转移场景,介绍了 Attributeless-I-RAVEN 和 I-RAVEN-Mesh 两个数据集,以及一种名为 PoNG 的新型神经架构,用于解决抽象视觉推理任务。
Jun, 2024
提出了基于 Contrastive Perceptual Inference network (CoPiNet) 的 Vision Transformer Contrastive Network, 结合心理学、认知学和教育学,采用先进的 Vision Transformer 架构,从像素级输入和全局特征上进一步改进了机器处理和推理空间 - 时间信息在 RAVEN 数据集上的能力。
Mar, 2024
本文总结了近年来深度学习方法在抽象视觉推理领域的应用研究进展,并重点关注了目前最普遍的抽象视觉推理任务 —— 瑞文渐进矩阵(RPM),并提供了综合的深度神经模型和学习方法以及 RPM 基准集的分析,对现有方法的性能进行了分析,为当前和未来研究的趋势提供了见解和意见,并最终展示了实际问题如何受益于 RPM 研究的发现。
Jan, 2022
通过使用神经网络来解决 “渐进矩阵” 谜题,本研究旨在提高机器的抽象推理能力。我们提出了一种简单而有效的双重对比网络(DCNet)来利用谜题的固有结构。实验结果表明,DCNet 在性能上优于最先进的方法。
May, 2022
通过实验和分析发现,具有良好归纳偏差的端到端神经网络可以优雅地解决 RAVEN 渐进矩阵问题,没有额外的元数据或任何特定骨干的偏好,多视角和多评估是成功推理的关键学习策略。
Oct, 2022
基于变压器蓝图的深度学习架构,解决抽象推理任务中的挑战,通过预测个体对象及其布局的视觉属性来选择答案,并在实验评估中优于现有方法,提供关于推理的有趣见解和部分解释,同时免疫某些 RPM 基准中已知的偏见。
Aug, 2023