可解释的直觉物理模型
该论文提出了一种神经模型,同时基于物理学原理和视觉先验进行推理和预测,通过对粒子的估计预测物理参数,即视觉基础,并在刚体、可变形材料和流体的复杂环境中证明了它的有效性,允许模型在几次观察内推断出物理特性,从而快速适应未见过的场景并进行准确的未来预测。
Apr, 2020
本论文提出了一项基于视觉任务的评估基准,以测试人工系统对于宏观物体、运动、力等物理理解的程度,同时介绍了两个旨在以无监督的方式学习直观物理的深度神经网络系统,并通过与人类数据的比较,对下一帧预测建筑的潜力和限制进行了新颖的结果分析。
Mar, 2018
提出了一种名为 Physion++ 的数据集和评测基准,旨在严格评估视觉物理预测在人工系统中的表现,其中预测依赖于对场景中物体的潜在物理属性的准确估计,结果发现,所有现有的先进模型都没有像人类一样学习进行物理预测。
Jun, 2023
本文介绍了一个无需监督训练的系统 PHYsical Concepts Inference NEtwork (PHYCINE),该系统可以发现和表示物理概念,包括物质和电荷,并且使用这些变量来获得比仅使用可见对象特征更好的因果推理性能。
Mar, 2023
本论文提出了一种通过学习多视角 RGB 图像预测场景未来发展的 3D 模型的框架,并使用条件神经辐射场视觉前端和 3D 基点动态预测后端来捕获底层环境的结构以及强关系和结构归纳偏差,相较于先前的方法,我们的模型对准确的点估计和跟踪不再具有依赖性,可以应对较复杂的场景,并在长时间预测方面表现较好。
Apr, 2023
本文综述了基于直觉物理的深度学习方法在物理推理方面的最新进展和技术。将现有的深度学习技术分为三个方面的物理推理,并将其组织为三种一般的技术方法,提出了该领域的六个分类任务。最后,本文强调了当前领域的挑战并提出了一些未来的研究方向。
Feb, 2022
本文研究物理场景下人类行为的特征及其功能形式,通过实验数据模拟并最终发现最佳预测模型为基于物理预测损失的敌对奖励模型,同时简单场景特征模型并不能跨越不同场景泛化其对人类响应的预测。人类会被驱使进入会带来大量信息与活动的情境中。
May, 2023
该论文介绍了一种新的算法,利用由 Observer Engine 和 Physicist Engine 组成的流程来从视频中推断出物理规律和数学公式,实验结果表明该算法能够有效地应用在不同的物理世界中。
Nov, 2018
本文中,我们探讨了一种方法,能够让智能体装备内部的世界动态模型,并通过运行多个内部仿真(“视觉想象”)来规划新型动作。我们的模型直接处理原始视觉输入,并使用基于目标中心的视觉快照(聚焦)的新颖物体中心预测公式来强制学习物理定律的平移不变性。我们的智能体可以通过随机与不同环境的集合进行交互来收集训练数据,然后可以使用所得到的模型在未见过的环境中规划目标导向的行动。我们展示了我们的智能体可以准确地规划模拟台球游戏中的行动,该游戏需要将球推向目标位置或使其与其他球碰撞。
Nov, 2015