I-PHYRE:交互式物理推理
这篇研究论文介绍了 PHYRE 物理推理基准测试,旨在鼓励开发机器学习算法以在简单的经典力学 2D 物理环境中进行样本高效且泛化良好的推理。测试表明,现有的算法在 PHYRE 上表现不佳。希望这个基准测试能够鼓励开发出学习高效有用的物理模型的新型样本高效智能体。
Aug, 2019
该研究旨在促进具备应对物理情境中异常情况能力的智能体的发展,通过开发一个新的测试平台 NovPhy 并在其中设计了 8 种不同类型的异常情境,并运用到 5 个常见的物理情境中,测试了人类、学习智能体和启发式智能体的表现,结果表明人类的表现远远超过智能体,并引发对如何设计更为智能的物理智能体的思考。
Mar, 2023
本论文提出了一项基于视觉任务的评估基准,以测试人工系统对于宏观物体、运动、力等物理理解的程度,同时介绍了两个旨在以无监督的方式学习直观物理的深度神经网络系统,并通过与人类数据的比较,对下一帧预测建筑的潜力和限制进行了新颖的结果分析。
Mar, 2018
该论文介绍了 PhyPlan,一个物理信息规划框架,它结合了物理信息神经网络(PINNs)和改进的蒙特卡洛树搜索(MCTS),使具有动态物理任务执行能力的代理人能够进行位置规划,并解决包括动态技能组合的三维物理推理任务。
Feb, 2024
PhyPlan 是一个结合物理信息的规划框架,利用物理信息神经网络(PINNs)和修改的蒙特卡洛树搜索(MCTS)使得具体化代理能够执行动态物理任务,并在求解 3D - 物理推理任务方面展现出较低的后悔、加速技能学习和提高物理推理速度、比非物理信息方法展现更高的数据效率。
Apr, 2024
物理推理是开发通用人工智能系统的关键因素,本论文旨在提供现有基准的综述及其解决方法,并提出了衡量人工智能系统物理推理能力的统一观点。我们选择了设计用于测试物理推理任务中算法性能的基准。虽然每个选定的基准都提出了独特的挑战,但它们的集合为具有各种物理推理概念可测量技能水平的通用 AI 代理提供了全面的实践场所。因此,这些基准集合相较于旨在模拟现实世界并交织其复杂性和许多概念的综合基准具有优势。我们将所呈现的一组物理推理基准分为子类别,以首先在这些组上对更窄的通用 AI 代理进行测试。
Dec, 2023
通过使用 MuJoCo 物理引擎和高质量渲染器 Blender,我们引入一个新的模拟环境,以提供既逼真又准确反映物理环境状态的视觉观察。除此之外,我们还提出了一个由 10 类多步骤推理场景构成的新基准,并开发了一种新的模块化闭环交互式推理(CLIER)方法,考虑到非视觉对象属性的测量、外部干扰引起的场景变化以及机器人动作的不确定结果。我们在模拟环境和实际操作任务中对我们的推理方法进行了广泛评估,并取得了分别高达 76% 和 64% 的成功率。
Apr, 2024
本文介绍了交互网络模型,它能够推断复杂系统中物体之间相互作用的方式,支持对系统动态预测,以及对系统抽象属性的推理。该模型使用深度神经网络进行对象和关系居中的推理,并可以推理多种具有挑战性的物理领域。 报告结果表明,它能够训练准确地模拟数十个对象在数千个时间步骤上的物理轨迹,估计能量等抽象量,自动推广到具有不同数量和配置的对象和关系的系统中。 该交互网络的实现是第一个通用的,可学习的物理引擎,是处理各种复杂真实世界领域中物体和关系的强大的通用框架。
Dec, 2016