提出了基于 Contrastive Perceptual Inference network (CoPiNet) 的 Vision Transformer Contrastive Network, 结合心理学、认知学和教育学,采用先进的 Vision Transformer 架构,从像素级输入和全局特征上进一步改进了机器处理和推理空间 - 时间信息在 RAVEN 数据集上的能力。
Mar, 2024
本文提出了一种分层规则感知网络(SRAN),以解决图形推理测试 RPM 中的互补偏差问题,并引入了用于创建改进数据集 I-RAVEN 的答案集生成算法
Feb, 2020
基于变压器蓝图的深度学习架构,解决抽象推理任务中的挑战,通过预测个体对象及其布局的视觉属性来选择答案,并在实验评估中优于现有方法,提供关于推理的有趣见解和部分解释,同时免疫某些 RPM 基准中已知的偏见。
Aug, 2023
探究对象为中心的编码器和变换推理模块是否能提高图像推理任务的效果,并发现其比传统以 Raven 智力测试为基础的任务特定归纳偏见更全面适用。
Mar, 2023
提出了一种基于条件生成模型的解答生成方法,通过使用潜在空间中的规则抽象和选择(RAISE)来编码图像属性、分解潜在规则,并在生成答案时选择适当的原子规则,以解决 Raven's Progressive Matrix(RPM)中的抽象视觉推理问题。RAISE 在生成底部右侧和任意位置的答案任务中优于其他生成求解器,并通过奇异法找到违反潜在规则的图像,处理具有未见规则和属性组合的 RPM。
Jan, 2024
通过实验和分析发现,具有良好归纳偏差的端到端神经网络可以优雅地解决 RAVEN 渐进矩阵问题,没有额外的元数据或任何特定骨干的偏好,多视角和多评估是成功推理的关键学习策略。
Oct, 2022
提出了一种深度潜变量模型来学习可解释的概念,并在该过程中分析潜在空间中的概念转换规则,自动抽象出数据集上共享的全局规则,并实现抽象位置上的答案生成任务。
Jul, 2023
本文介绍了利用神经网络进行 RPM 问题的监督学习和无监督学习,同时提出了一种基于伪标签的无监督学习方法 MCPT,可显著提高测试准确率,并探讨了未来使用无监督和可解释性策略来解决 RPM 问题的问题。
本文总结了近年来深度学习方法在抽象视觉推理领域的应用研究进展,并重点关注了目前最普遍的抽象视觉推理任务 —— 瑞文渐进矩阵(RPM),并提供了综合的深度神经模型和学习方法以及 RPM 基准集的分析,对现有方法的性能进行了分析,为当前和未来研究的趋势提供了见解和意见,并最终展示了实际问题如何受益于 RPM 研究的发现。
Jan, 2022
研究在抽象视觉推理领域中,深度神经网络的泛化和知识重用能力,通过使用 Raven's Progressive Matrices(RPMs)作为评估抽象视觉推理能力的基准任务。通过研究两种知识转移场景,介绍了 Attributeless-I-RAVEN 和 I-RAVEN-Mesh 两个数据集,以及一种名为 PoNG 的新型神经架构,用于解决抽象视觉推理任务。
Jun, 2024