SAMPLE-HD: 同时动作和运动规划学习环境
本文认为模拟平台使得新型的具身空间推理得以实现,它由物体和事件语义的形式化模型所促进,这使得开放式、实时环境的连续定量搜索空间变得易处理。通过示例,本文说明了一种基于语义的人工智能系统如何利用游戏引擎提供的精确数值信息来执行关于物体和事件的定性推理、从数据中学习新概念、与人类进行交流以提高其模型并展示其理解。本文认为模拟环境,特别是游戏引擎,整合了许多不同的 “模拟” 概念和许多不同的技术,为开发机器和人类智能方面的人工智能系统和工具提供了高效的平台.
Feb, 2019
本文介绍了一种基于对抗特征调整模型的 3D 室内导航机器人训练方法,通过视觉特征的转换与行为策略的模仿来提高机器人在真实环境中的表现。实验证明该方法能够在不需要额外人工注释的情况下,比基线方法表现提高 19.47%。
Apr, 2019
大规模仿真学习研究证明在新环境中使用人类示范对比传统的强化学习对于机器人物品寻找的效率更高,在目标导航和 Pick&Place 方面都表现出良好的表现,并呈现出不错的收缩算法的可能性。
Apr, 2022
通过构建大规模数据集,研究了语言引导的视觉导航中各个组成部分对代理性能的影响,并通过简单模仿学习将现有代理的性能推向了一个显著的新高度,成功率达到了 80%,并将在已见和未见环境中导航的泛化差距降低到不到 1%。
Jul, 2023
通过 Virtual Tools 游戏,建立了 Sample, Simulate, Update (SSUP) 模型,探究人类灵活解决物理问题的能力,揭示人类将一般物理知识转化为特定任务的行动计划的机制。
Jul, 2019
本文描述了一种音频 - 视觉导航方案,该方案基于移动智能机器人,利用可微卷积神经网络学习视觉感知器和声音感知器,以及动态路径规划器,实现在室内环境中通过音频和视觉数据计算从机器人当前位置到声源的最短路径。
Dec, 2019
本文主要研究在 assistive tasks 中应用 sim2real 技术时的问题,并提出了一种解决方案 —— 通过学习一种好的 latent representation 来匹配 test-time humans 能够准确映射到的人类策略,并且在 test-time 进行 fine-tune,这样能够更好地结构化人类策略。
Dec, 2022
提出了一种基于强化学习的方法来处理 3D 室内场景中虚拟人类与环境以及物体的交互,包括生成运动模型、创新的碰撞回避奖励函数、基于标记体和半径场的交互感知奖励函数以及训练策略等多个方面,实验结果表明,该方法在运动的自然性和多样性方面都优于现有的人 - 场景交互综合框架。
May, 2023