Oct, 2019

使用模拟飞行学习将自然语言指令映射到物理四轴飞行器控制

TL;DR提出一种联合仿真和现实学习框架,将导航指令和第一人称视角的原始观察结果映射到连续控制上,并采用监督式加强异步学习算法,将仿真和真实环境结合起来进行训练,最终在一个自然语言指令遵从的物理四轴飞行器任务中验证其有效性。