SAMPLE-HD: 同时动作和运动规划学习环境

CVPRJun, 2022

SAMPLE-HD: 同时动作和运动规划学习环境

SAMPLE-HD: Simultaneous Action and Motion Planning Learning Environment

Michal Nazarczuk, Tony Ng, Krystian Mikolajczyk

TL;DR本文提供了一个新的环境，用于学习交互式推理的视觉和行为方面的模拟，以掌握家庭用品的操作技能，并利用 SAMPLE-HD 环境生成场景、语言指令和训练路径。

Abstract

Humans exhibit incredibly high levels of multi-modal understanding - combining visual cues with read, or heard knowledge comes easy to us and allows for very accurate interaction with the surrounding environment. Various →

multi-modal understanding simulation environments interactive reasoning manipulation setup sample-hd environment

发现论文，激发创造

多模态模拟环境下的情境化基础建设

本文认为模拟平台使得新型的具身空间推理得以实现，它由物体和事件语义的形式化模型所促进，这使得开放式、实时环境的连续定量搜索空间变得易处理。通过示例，本文说明了一种基于语义的人工智能系统如何利用游戏引擎提供的精确数值信息来执行关于物体和事件的定性推理、从数据中学习新概念、与人类进行交流以提高其模型并展示其理解。本文认为模拟环境，特别是游戏引擎，整合了许多不同的 “模拟” 概念和许多不同的技术，为开发机器和人类智能方面的人工智能系统和工具提供了高效的平台.

Feb, 2019

采用分层式 Sim2Real 实现的多智能体运动操控

采用强化学习方法通过层次性模拟实现在多移动机器人协作下的操纵行为。

Aug, 2019

Sim-Real 联合强化迁移学习在 3D 室内导航中的应用

本文介绍了一种基于对抗特征调整模型的 3D 室内导航机器人训练方法，通过视觉特征的转换与行为策略的模仿来提高机器人在真实环境中的表现。实验证明该方法能够在不需要额外人工注释的情况下，比基线方法表现提高 19.47%。

Apr, 2019

Habitat-Web: 从大规模人类演示中学习具身体物体搜索策略

大规模仿真学习研究证明在新环境中使用人类示范对比传统的强化学习对于机器人物品寻找的效率更高，在目标导航和 Pick＆Place 方面都表现出良好的表现，并呈现出不错的收缩算法的可能性。

Apr, 2022

多模态多人行为生成建模

提出了一种建模和预测人类行为的方法，将人类建模为图形模型中的节点，并为每个人学习多模态概率分布，以预测日常交互中的未来行为。

Mar, 2018

视觉与语言导航中的数据生成扩展

通过构建大规模数据集，研究了语言引导的视觉导航中各个组成部分对代理性能的影响，并通过简单模仿学习将现有代理的性能推向了一个显著的新高度，成功率达到了 80％，并将在已见和未见环境中导航的泛化差距降低到不到 1％。

Jul, 2023

使用模拟快速试错学习支持灵活的工具使用和物理推理

通过 Virtual Tools 游戏，建立了 Sample, Simulate, Update (SSUP) 模型，探究人类灵活解决物理问题的能力，揭示人类将一般物理知识转化为特定任务的行动计划的机制。

Jul, 2019

观察，聆听和行动：走向音频视觉具身化导航

本文描述了一种音频 - 视觉导航方案，该方案基于移动智能机器人，利用可微卷积神经网络学习视觉感知器和声音感知器，以及动态路径规划器，实现在室内环境中通过音频和视觉数据计算从机器人当前位置到声源的最短路径。

Dec, 2019

学习使辅助任务泛化的表示

本文主要研究在 assistive tasks 中应用 sim2real 技术时的问题，并提出了一种解决方案 —— 通过学习一种好的 latent representation 来匹配 test-time humans 能够准确映射到的人类策略，并且在 test-time 进行 fine-tune，这样能够更好地结构化人类策略。

Dec, 2022

在 3D 室内场景中合成多样的人体动作

提出了一种基于强化学习的方法来处理 3D 室内场景中虚拟人类与环境以及物体的交互，包括生成运动模型、创新的碰撞回避奖励函数、基于标记体和半径场的交互感知奖励函数以及训练策略等多个方面，实验结果表明，该方法在运动的自然性和多样性方面都优于现有的人 - 场景交互综合框架。

May, 2023