介绍一种新的代数机器推理框架,将 Raven 渐进矩阵问题求解转化为代数计算,利用理想的 Gröbner 基计算等数学算法,能够从答案集合中选出正确答案并仅凭问题矩阵就生成正确答案,试验在 I-RAVEN 数据集上达到 93.2% 的准确率,超过当前最先进的 77.0% 和人类表现的 84.4% 准确率。
Mar, 2023
基于变压器蓝图的深度学习架构,解决抽象推理任务中的挑战,通过预测个体对象及其布局的视觉属性来选择答案,并在实验评估中优于现有方法,提供关于推理的有趣见解和部分解释,同时免疫某些 RPM 基准中已知的偏见。
Aug, 2023
本文总结了近年来深度学习方法在抽象视觉推理领域的应用研究进展,并重点关注了目前最普遍的抽象视觉推理任务 —— 瑞文渐进矩阵(RPM),并提供了综合的深度神经模型和学习方法以及 RPM 基准集的分析,对现有方法的性能进行了分析,为当前和未来研究的趋势提供了见解和意见,并最终展示了实际问题如何受益于 RPM 研究的发现。
Jan, 2022
探究对象为中心的编码器和变换推理模块是否能提高图像推理任务的效果,并发现其比传统以 Raven 智力测试为基础的任务特定归纳偏见更全面适用。
这篇论文全面介绍了关于 RPM 的计算模型,包括历史、智力测量理论、项目设计和自动生成、计算模型的概念史,以及将人类智力测试和 AI 测试进行比较并提出建议。
Feb, 2023
提出了基于 Contrastive Perceptual Inference network (CoPiNet) 的 Vision Transformer Contrastive Network, 结合心理学、认知学和教育学,采用先进的 Vision Transformer 架构,从像素级输入和全局特征上进一步改进了机器处理和推理空间 - 时间信息在 RAVEN 数据集上的能力。
Mar, 2024
通过将人类语言与类比制造联系起来,我们使用大规模预训练的语言模型(PLMs)来支持人工智能系统的类比能力,将感知特征转换成语言形式,PLMs 展现出惊人的零 - shot 关系推理能力,并在 RPM 测试中接近监督的以视觉为基础的方法。
May, 2023
本研究提出了一个新的数据集,旨在通过在分层表示中将视觉与结构、关系和类比推理相匹配,提高机器智能水平,并通过加入神经模块组合视觉理解和结构推理,持续改进所有模型的性能,实现现代视觉与机器推理的结合。
Mar, 2019
提出了一种基于条件生成模型的解答生成方法,通过使用潜在空间中的规则抽象和选择(RAISE)来编码图像属性、分解潜在规则,并在生成答案时选择适当的原子规则,以解决 Raven's Progressive Matrix(RPM)中的抽象视觉推理问题。RAISE 在生成底部右侧和任意位置的答案任务中优于其他生成求解器,并通过奇异法找到违反潜在规则的图像,处理具有未见规则和属性组合的 RPM。
Jan, 2024
本文探讨了如何通过心理学、认知科学和教育学的思想来设计和训练一个置换不变的模型,以提高机器在空间 / 时间推理方面的推理能力。通过 Contrastive Perceptual Inference network (CoPINet) 的实验,我们证明了它在两个主要数据集上设置了新的技术水平,从而提高了机器在思维空间 / 时间推理方面的能力。
Nov, 2019