I-PHYRE：交互式物理推理

Dec, 2023

I-PHYRE: Interactive Physical Reasoning

Shiqian Li, Kewen Wu, Chi Zhang, Yixin Zhu

TL;DR为了解决现有学习算法与人类表现之间的差距并强调增强代理人的交互式物理推理能力的重要性，我们介绍了 I-PHYRE 框架，该框架要求代理人同时展示直觉的物理推理、多步规划和原位干预，通过代表性场景的互动促进学习。

Abstract

Current evaluation protocols predominantly assess physical reasoning in stationary scenes, creating a gap in evaluating agents' abilities to interact with →

evaluation protocols physical reasoning dynamic events multi-step planning interactive physical reasoning

发现论文，激发创造

PHYRE：物理推理的新基准

这篇研究论文介绍了 PHYRE 物理推理基准测试，旨在鼓励开发机器学习算法以在简单的经典力学 2D 物理环境中进行样本高效且泛化良好的推理。测试表明，现有的算法在 PHYRE 上表现不佳。希望这个基准测试能够鼓励开发出学习高效有用的物理模型的新型样本高效智能体。

Aug, 2019

NovPhy：开放环境中物理推理的测试平台

该研究旨在促进具备应对物理情境中异常情况能力的智能体的发展，通过开发一个新的测试平台 NovPhy 并在其中设计了 8 种不同类型的异常情境，并运用到 5 个常见的物理情境中，测试了人类、学习智能体和启发式智能体的表现，结果表明人类的表现远远超过智能体，并引发对如何设计更为智能的物理智能体的思考。

Mar, 2023

IntPhys: 视觉直觉物理推理的框架和基准

本论文提出了一项基于视觉任务的评估基准，以测试人工系统对于宏观物体、运动、力等物理理解的程度，同时介绍了两个旨在以无监督的方式学习直观物理的深度神经网络系统，并通过与人类数据的比较，对下一帧预测建筑的潜力和限制进行了新颖的结果分析。

Mar, 2018

PhyPlan：机器人操纵器的组合和自适应物理任务推理基于物理信息的技能网络

该论文介绍了 PhyPlan，一个物理信息规划框架，它结合了物理信息神经网络（PINNs）和改进的蒙特卡洛树搜索（MCTS），使具有动态物理任务执行能力的代理人能够进行位置规划，并解决包括动态技能组合的三维物理推理任务。

Feb, 2024

利用具有动态感知能力的模型进行物理推理

通过自我监督的信号增强奖励价值，将模型训练出了刻画两个物理场景间相似度的能力，从而在 PHYRE 基准测试中显著提升了表现。

Feb, 2021

ESPRIT: 解释物理推理任务的解决方案

提出了一种用于定性物理常识推理的 ESPRTI 框架，可以使用解释性自然语言描述物理事件，从而灵活地适应未被训练过的场景和任务。

May, 2020

PhyPlan: 机器人操纵器的物理感知技能网络通用和快速物理任务规划

PhyPlan 是一个结合物理信息的规划框架，利用物理信息神经网络（PINNs）和修改的蒙特卡洛树搜索（MCTS）使得具体化代理能够执行动态物理任务，并在求解 3D - 物理推理任务方面展现出较低的后悔、加速技能学习和提高物理推理速度、比非物理信息方法展现更高的数据效率。

Apr, 2024

物理推理 AI 的基准测试

物理推理是开发通用人工智能系统的关键因素，本论文旨在提供现有基准的综述及其解决方法，并提出了衡量人工智能系统物理推理能力的统一观点。我们选择了设计用于测试物理推理任务中算法性能的基准。虽然每个选定的基准都提出了独特的挑战，但它们的集合为具有各种物理推理概念可测量技能水平的通用 AI 代理提供了全面的实践场所。因此，这些基准集合相较于旨在模拟现实世界并交织其复杂性和许多概念的综合基准具有优势。我们将所呈现的一组物理推理基准分为子类别，以首先在这些组上对更窄的通用 AI 代理进行测试。

Dec, 2023

闭环交互式具身推理的机器人操控

通过使用 MuJoCo 物理引擎和高质量渲染器 Blender，我们引入一个新的模拟环境，以提供既逼真又准确反映物理环境状态的视觉观察。除此之外，我们还提出了一个由 10 类多步骤推理场景构成的新基准，并开发了一种新的模块化闭环交互式推理（CLIER）方法，考虑到非视觉对象属性的测量、外部干扰引起的场景变化以及机器人动作的不确定结果。我们在模拟环境和实际操作任务中对我们的推理方法进行了广泛评估，并取得了分别高达 76% 和 64% 的成功率。

Apr, 2024

利用交互网络学习关于物体、关系和物理的知识

本文介绍了交互网络模型，它能够推断复杂系统中物体之间相互作用的方式，支持对系统动态预测，以及对系统抽象属性的推理。该模型使用深度神经网络进行对象和关系居中的推理，并可以推理多种具有挑战性的物理领域。报告结果表明，它能够训练准确地模拟数十个对象在数千个时间步骤上的物理轨迹，估计能量等抽象量，自动推广到具有不同数量和配置的对象和关系的系统中。该交互网络的实现是第一个通用的，可学习的物理引擎，是处理各种复杂真实世界领域中物体和关系的强大的通用框架。

Dec, 2016