基于面向对象预测和规划的物理交互推理
该论文测试了一种新的模型,可以通过对象之间的本地交互来建模场景,而不是全局建模,从而在泛化到以前未遇到过的组合空间的物理任务时提供巨大的益处。论文提出了一种名为 OP3 的实体为中心的感知、预测和规划的方法,使用它可以预测和规划具有不同数量和配置的对象的模型,没有监督的学习构建实体表示。OP3 通过对每个实体表示的对称处理来强制执行实体抽象,这使得它能够扩展到训练中没有观察到的不同数量和配置的对象上。该方法的主要技术挑战在于将这些实体表示地面化到环境中的实际对象,该论文将该变量绑定问题视为推理问题,并开发了一种交互式推理算法,该算法使用时间连续性和交互式反馈将关于对象属性的信息绑定到实体变量上。在堆叠积木任务中,OP3 泛化到新的积木配置和比训练时观察到的对象更多的对象,表现优于假设具有对象监督能力的 oracle 模型,比不表现实体抽象的最先进视频预测模型的准确率高两到三倍。
Oct, 2019
开发了一个动作条件视频预测模型,能够显式地模拟像素运动,从而学习关于物理对象运动的知识。同时,模型对对象外貌部分不变,可对以前未见过的对象进行推广。我们介绍了一个包含推动动作的 59,000 个机器人交互数据集,包括一个具有新颖对象的测试集。实验结果表明,与现有方法相比,我们的方法在定量和定性方面都能更准确地预测视频。
May, 2016
利用仅依赖于大脑可访问的信息进行训练的图像序列和自我运动,我们开发了一种新颖的网络架构,能够同时学习从离散图像中分割对象、推断其三维位置和感知深度,从而作为预测学习的副产品有效地学习对象的表示。
Mar, 2024
本文提出了一种利用符号规划的方法,采用先前的训练数据自动训练神经网络识别物体属性的方法,并使用规划技术来自动化训练数据集的创建和学习过程。最后,我们在模拟和真实环境中进行了实验评估,结果表明所提出的方法能够成功地学习如何识别新的物体属性。
Jan, 2023
本文提出了一种方法来解决复杂开放环境下机器人操作的问题,该方法基于先前训练的通用视觉模型作为感知系统的对象先验,并引入了一个基于对象的注意机制来确定相关对象,通过少数轨迹或演示将这些对象纳入学习策略,使用强化学习可以学习多种操作任务。
Aug, 2017
提出了一种名为 Physion++ 的数据集和评测基准,旨在严格评估视觉物理预测在人工系统中的表现,其中预测依赖于对场景中物体的潜在物理属性的准确估计,结果发现,所有现有的先进模型都没有像人类一样学习进行物理预测。
Jun, 2023
本文介绍了一个无需监督训练的系统 PHYsical Concepts Inference NEtwork (PHYCINE),该系统可以发现和表示物理概念,包括物质和电荷,并且使用这些变量来获得比仅使用可见对象特征更好的因果推理性能。
Mar, 2023
该论文提出了一种神经模型,同时基于物理学原理和视觉先验进行推理和预测,通过对粒子的估计预测物理参数,即视觉基础,并在刚体、可变形材料和流体的复杂环境中证明了它的有效性,允许模型在几次观察内推断出物理特性,从而快速适应未见过的场景并进行准确的未来预测。
Apr, 2020