BriefGPT.xyz
Ask
alpha
关键词
simulated robotics
搜索结果 - 4
ICLR
规划探索目标
本文提出了 Planning Exploratory Goals(PEG)方法,在目标条件强化学习中以直接优化内在探索奖励为目的,为每个训练周期设置目标,从而最大限度地探索环境,通过学习世界模型和适应采样规划算法来规划目标命令,从而实现更有
→
PDF
a year ago
EMNLP
通过分解学习自适应语言界面
该研究旨在创建一个交互式、自然语言接口,通过学习用户在模拟机器人环境中完成任务。该接口引入了一种神经语义解析系统,通过分解学习新的高层抽象:用户通过将描述新行为的高层话语分解为它可以理解的低级步骤来与系统互动。作者的方法弥合了现有方法之间的
→
PDF
4 years ago
ICML
多任务最大熵逆强化学习
本文提出了在最大因果熵 IRL 框架中的多任务 IRL 的公式化,通过单次模仿学习可以解决单任务 IRL 算法需要数百个演示才能解决的网格环境中的问题,并在常见模拟机器人基准的多任务变体上评估这些 IRL 算法,发现了其严重的限制,并提出了
→
PDF
6 years ago
域随机化:从仿真到真实世界的深度神经网络转移
探究了一种称为 “Domain Randomization” 的技术,该技术使用非真实随机纹理来训练深度神经网络对象定位器,使得该定位器在真实环境中表现出色,并且可以应用于机器人控制中。
PDF
7 years ago
Prev
Next