使用模拟快速试错学习支持灵活的工具使用和物理推理

Jul, 2019

使用模拟快速试错学习支持灵活的工具使用和物理推理

Rapid trial-and-error learning with simulation supports flexible tool use and physical reasoning

Kelsey R. Allen, Kevin A. Smith, Joshua B. Tenenbaum

TL;DR通过 Virtual Tools 游戏，建立了 Sample, Simulate, Update (SSUP) 模型，探究人类灵活解决物理问题的能力，揭示人类将一般物理知识转化为特定任务的行动计划的机制。

Abstract

Many animals, and an increasing number of artificial agents, display sophisticated capabilities to perceive and manipulate objects. But human beings remain distinctive in their capacity for flexible, creative tool use -- using objects in new ways to act on the world, achieve a goal, or solve a problem. To study this type of general →

flexible tool use physical problem solving virtual tools game action priors ssup model

发现论文，激发创造

通过物理理解进行即兴发挥：利用新颖物品及视觉先见的工具

通过机器学习技术，训练视觉和物理多物互动理解的模型，并开发了一个基于样本的优化器来实现复杂的工具使用任务，实验表明目前此方法可以通过原始像素输入解决多种复杂的工具使用任务，能够感知和使用新的对象作为工具，同时根据需要灵活选择是否使用工具。

Apr, 2019

SAMPLE-HD: 同时动作和运动规划学习环境

本文提供了一个新的环境，用于学习交互式推理的视觉和行为方面的模拟，以掌握家庭用品的操作技能，并利用 SAMPLE-HD 环境生成场景、语言指令和训练路径。

Jun, 2022

理解物理效应以实现有效的工具使用

本研究提出了一种基于机器人学习和规划框架的工具使用策略，通过使用 Finite Element Method 仿真器和 Iterative Deepening Symbolic Regression 算法，实现更加高效、精准的物理模拟和最优化控制设计方法。

Jun, 2022

学习可重用操纵策略

通过单次演示和自我学习，提出了一种机器学习的框架，使机器能够获得灵活的操作技能，将其称为 “机制”。这些学习到的机制和采样器可以无缝地整合到标准的任务和动作规划器中，实现它们的组合使用。

Nov, 2023

具有泛化能力的投影模拟

通过提出几个泛化的标准以及一种动态且自主的机制，本文介绍了如何在项目模拟智能代理中实现有意义的泛化，从而使代理可以学习和应对大量数据，配合一个基于非常简单的原则的基本的项目模拟模型和泛化机制，使我们能够全面分析代理的性能并展示它通过泛化的益处。

Apr, 2015

通过轨迹生成学习通用工具使用技能

通过生成模型学习工具使用轨迹和对应工具位姿的序列，以实现对变形物体的操纵，进而提高自治系统在常见任务（如烹饪和清洁）中的智能水平。

Sep, 2023

面向心智理论启发的通用决策框架

本研究提出了一个基于 Theory of Mind 的通用框架，允许智能体使用多个模拟来推导和行动，以通过模拟决策过程解决在 IJCAI2013 AIBirds 竞赛中的流行游戏。

May, 2014

学习物理模型的视觉定位

该论文提出了一种神经模型，同时基于物理学原理和视觉先验进行推理和预测，通过对粒子的估计预测物理参数，即视觉基础，并在刚体、可变形材料和流体的复杂环境中证明了它的有效性，允许模型在几次观察内推断出物理特性，从而快速适应未见过的场景并进行准确的未来预测。

Apr, 2020

IntPhys: 视觉直觉物理推理的框架和基准

本论文提出了一项基于视觉任务的评估基准，以测试人工系统对于宏观物体、运动、力等物理理解的程度，同时介绍了两个旨在以无监督的方式学习直观物理的深度神经网络系统，并通过与人类数据的比较，对下一帧预测建筑的潜力和限制进行了新颖的结果分析。

Mar, 2018

多模态模拟环境下的情境化基础建设

本文认为模拟平台使得新型的具身空间推理得以实现，它由物体和事件语义的形式化模型所促进，这使得开放式、实时环境的连续定量搜索空间变得易处理。通过示例，本文说明了一种基于语义的人工智能系统如何利用游戏引擎提供的精确数值信息来执行关于物体和事件的定性推理、从数据中学习新概念、与人类进行交流以提高其模型并展示其理解。本文认为模拟环境，特别是游戏引擎，整合了许多不同的 “模拟” 概念和许多不同的技术，为开发机器和人类智能方面的人工智能系统和工具提供了高效的平台.

Feb, 2019