RAVEN: 用于关系和类比视觉推理的数据集
提出了基于 Contrastive Perceptual Inference network (CoPiNet) 的 Vision Transformer Contrastive Network, 结合心理学、认知学和教育学,采用先进的 Vision Transformer 架构,从像素级输入和全局特征上进一步改进了机器处理和推理空间 - 时间信息在 RAVEN 数据集上的能力。
Mar, 2024
本文总结了近年来深度学习方法在抽象视觉推理领域的应用研究进展,并重点关注了目前最普遍的抽象视觉推理任务 —— 瑞文渐进矩阵(RPM),并提供了综合的深度神经模型和学习方法以及 RPM 基准集的分析,对现有方法的性能进行了分析,为当前和未来研究的趋势提供了见解和意见,并最终展示了实际问题如何受益于 RPM 研究的发现。
Jan, 2022
研究在抽象视觉推理领域中,深度神经网络的泛化和知识重用能力,通过使用 Raven's Progressive Matrices(RPMs)作为评估抽象视觉推理能力的基准任务。通过研究两种知识转移场景,介绍了 Attributeless-I-RAVEN 和 I-RAVEN-Mesh 两个数据集,以及一种名为 PoNG 的新型神经架构,用于解决抽象视觉推理任务。
Jun, 2024
介绍一种新的代数机器推理框架,将 Raven 渐进矩阵问题求解转化为代数计算,利用理想的 Gröbner 基计算等数学算法,能够从答案集合中选出正确答案并仅凭问题矩阵就生成正确答案,试验在 I-RAVEN 数据集上达到 93.2% 的准确率,超过当前最先进的 77.0% 和人类表现的 84.4% 准确率。
Mar, 2023
基于变压器蓝图的深度学习架构,解决抽象推理任务中的挑战,通过预测个体对象及其布局的视觉属性来选择答案,并在实验评估中优于现有方法,提供关于推理的有趣见解和部分解释,同时免疫某些 RPM 基准中已知的偏见。
Aug, 2023
本文介绍使用类比和图像转换的计算模型解决 Raven 渐进矩阵测试问题,并证明了使用这些方法在标准版本中可以解决 57 个问题中的 60 个问题。
Aug, 2022
提出了一种基于条件生成模型的解答生成方法,通过使用潜在空间中的规则抽象和选择(RAISE)来编码图像属性、分解潜在规则,并在生成答案时选择适当的原子规则,以解决 Raven's Progressive Matrix(RPM)中的抽象视觉推理问题。RAISE 在生成底部右侧和任意位置的答案任务中优于其他生成求解器,并通过奇异法找到违反潜在规则的图像,处理具有未见规则和属性组合的 RPM。
Jan, 2024