Oct, 2018

神经模块化控制 —— 为具身问答而生

TL;DR该研究提出了一种模块化的方法,利用语言输入学习长期规划的导航策略。他们的分层策略在多个时间尺度上运行,并使用模块化和语义子目标,通过模仿学习和强化学习相结合的方法在 EQA 基准上表现出色,无论是在导航还是问题回答方面均优于前人工作。