使用模拟快速试错学习支持灵活的工具使用和物理推理
通过机器学习技术,训练视觉和物理多物互动理解的模型,并开发了一个基于样本的优化器来实现复杂的工具使用任务,实验表明目前此方法可以通过原始像素输入解决多种复杂的工具使用任务,能够感知和使用新的对象作为工具,同时根据需要灵活选择是否使用工具。
Apr, 2019
本文提供了一个新的环境,用于学习交互式推理的视觉和行为方面的模拟,以掌握家庭用品的操作技能,并利用 SAMPLE-HD 环境生成场景、语言指令和训练路径。
Jun, 2022
本研究提出了一种基于机器人学习和规划框架的工具使用策略,通过使用 Finite Element Method 仿真器和 Iterative Deepening Symbolic Regression 算法,实现更加高效、精准的物理模拟和最优化控制设计方法。
Jun, 2022
通过单次演示和自我学习,提出了一种机器学习的框架,使机器能够获得灵活的操作技能,将其称为 “机制”。这些学习到的机制和采样器可以无缝地整合到标准的任务和动作规划器中,实现它们的组合使用。
Nov, 2023
通过提出几个泛化的标准以及一种动态且自主的机制,本文介绍了如何在项目模拟智能代理中实现有意义的泛化,从而使代理可以学习和应对大量数据,配合一个基于非常简单的原则的基本的项目模拟模型和泛化机制,使我们能够全面分析代理的性能并展示它通过泛化的益处。
Apr, 2015
本研究提出了一个基于 Theory of Mind 的通用框架,允许智能体使用多个模拟来推导和行动,以通过模拟决策过程解决在 IJCAI2013 AIBirds 竞赛中的流行游戏。
May, 2014
该论文提出了一种神经模型,同时基于物理学原理和视觉先验进行推理和预测,通过对粒子的估计预测物理参数,即视觉基础,并在刚体、可变形材料和流体的复杂环境中证明了它的有效性,允许模型在几次观察内推断出物理特性,从而快速适应未见过的场景并进行准确的未来预测。
Apr, 2020
本论文提出了一项基于视觉任务的评估基准,以测试人工系统对于宏观物体、运动、力等物理理解的程度,同时介绍了两个旨在以无监督的方式学习直观物理的深度神经网络系统,并通过与人类数据的比较,对下一帧预测建筑的潜力和限制进行了新颖的结果分析。
Mar, 2018
本文认为模拟平台使得新型的具身空间推理得以实现,它由物体和事件语义的形式化模型所促进,这使得开放式、实时环境的连续定量搜索空间变得易处理。通过示例,本文说明了一种基于语义的人工智能系统如何利用游戏引擎提供的精确数值信息来执行关于物体和事件的定性推理、从数据中学习新概念、与人类进行交流以提高其模型并展示其理解。本文认为模拟环境,特别是游戏引擎,整合了许多不同的 “模拟” 概念和许多不同的技术,为开发机器和人类智能方面的人工智能系统和工具提供了高效的平台.
Feb, 2019