Nov, 2015

学习视觉预测物理模型以打台球

TL;DR本文中,我们探讨了一种方法,能够让智能体装备内部的世界动态模型,并通过运行多个内部仿真(“视觉想象”)来规划新型动作。我们的模型直接处理原始视觉输入,并使用基于目标中心的视觉快照(聚焦)的新颖物体中心预测公式来强制学习物理定律的平移不变性。我们的智能体可以通过随机与不同环境的集合进行交互来收集训练数据,然后可以使用所得到的模型在未见过的环境中规划目标导向的行动。我们展示了我们的智能体可以准确地规划模拟台球游戏中的行动,该游戏需要将球推向目标位置或使其与其他球碰撞。