学习视觉预测物理模型以打台球

Nov, 2015

Learning Visual Predictive Models of Physics for Playing Billiards

Katerina Fragkiadaki, Pulkit Agrawal, Sergey Levine, Jitendra Malik

TL;DR本文中，我们探讨了一种方法，能够让智能体装备内部的世界动态模型，并通过运行多个内部仿真（“视觉想象”）来规划新型动作。我们的模型直接处理原始视觉输入，并使用基于目标中心的视觉快照（聚焦）的新颖物体中心预测公式来强制学习物理定律的平移不变性。我们的智能体可以通过随机与不同环境的集合进行交互来收集训练数据，然后可以使用所得到的模型在未见过的环境中规划目标导向的行动。我们展示了我们的智能体可以准确地规划模拟台球游戏中的行动，该游戏需要将球推向目标位置或使其与其他球碰撞。

Abstract

The ability to plan and execute goal specific actions in varied, unexpected settings is a central requirement of intelligent agents. In this paper, we explore how an agent can be equipped with an internal model o

agent internal model visual imagination physical laws goal-directed actions

发现论文，激发创造

学习物理模型的视觉定位

该论文提出了一种神经模型，同时基于物理学原理和视觉先验进行推理和预测，通过对粒子的估计预测物理参数，即视觉基础，并在刚体、可变形材料和流体的复杂环境中证明了它的有效性，允许模型在几次观察内推断出物理特性，从而快速适应未见过的场景并进行准确的未来预测。

Apr, 2020

使用逆动力学模型从像素规划

提出了一种新的方法来学习依赖任务完成的未来动作序列预测的潜在世界模型，该模型适应地关注任务相关的动态学习，并同时充当稀疏奖励下计划的有效启发式方法，通过挑战性的视觉目标完成任务的评估，我们发现该方法较之前的无模型方法在性能上有了显著提高。

Dec, 2020

学习感知模型

本文考虑了一个代理与未知和不确定的外部世界交互的情况，我们展示了预测了代理身体固有信息的模型会代表外部世界的对象，并通过积极预测身体信号来学习动态模型的过程具有优异的控制性能，此外还展示了使用相同模型可以回答关于真实世界中对象属性的问题。

Apr, 2018

通过视觉规划和执行学习机器人操作

本文提出了一种基于数据驱动的建模方法，利用深度生成模型学习目标定向的物体操作，采用视觉规划和视觉跟踪控制解决目标检测问题。

May, 2019

直觉物理游戏中的概率编程机器人

该论文提出了一个使用概率编程工具与物理模拟引擎相结合的框架，用于向机器人提供直观的物理环境交互能力，并通过模型自由方法使采样程序变得更高效，从而在模型自由方法和模型为基础的方法之间找到平衡，并通过模拟 Flappy Bird 游戏的实验结果，展示了该模型的绩效。

Apr, 2021

通过视频预测进行物理交互的无监督学习

开发了一个动作条件视频预测模型，能够显式地模拟像素运动，从而学习关于物理对象运动的知识。同时，模型对对象外貌部分不变，可对以前未见过的对象进行推广。我们介绍了一个包含推动动作的 59,000 个机器人交互数据集，包括一个具有新颖对象的测试集。实验结果表明，与现有方法相比，我们的方法在定量和定性方面都能更准确地预测视频。

May, 2016

通过物理理解进行即兴发挥：利用新颖物品及视觉先见的工具

通过机器学习技术，训练视觉和物理多物互动理解的模型，并开发了一个基于样本的优化器来实现复杂的工具使用任务，实验表明目前此方法可以通过原始像素输入解决多种复杂的工具使用任务，能够感知和使用新的对象作为工具，同时根据需要灵活选择是否使用工具。

Apr, 2019

深度视觉预见性规划机器人动作

本论文提出一种基于无标注训练数据的方法，结合深度动作条件视频预测模型和模型预测控制，使真实机器人能够进行非抓取操作，比如推动物体，并且可以处理训练过程中没有出现过的新物体。

Oct, 2016

物体中心视觉预测的物理动态学习

本研究提出了一种无监督的物体中心预测模型，通过学习物体之间的视觉动态来进行未来预测，实验结果表明该模型在生成视觉质量和物理可靠性方面优于现有技术。

Mar, 2024

目标感知预测：学习如何模拟重要因素

该论文提出了一种基于自监督学习的学习动力学模型，该模型可用于任务规划和策略学习，避免了视觉控制任务中由于真实环境的复杂度超过模型容量所导致的训练效率低的问题。

Jul, 2020