BriefGPT.xyz
Ask
alpha
关键词
long planning horizons
搜索结果 - 1
神经模块化控制 —— 为具身问答而生
该研究提出了一种模块化的方法,利用语言输入学习长期规划的导航策略。他们的分层策略在多个时间尺度上运行,并使用模块化和语义子目标,通过模仿学习和强化学习相结合的方法在 EQA 基准上表现出色,无论是在导航还是问题回答方面均优于前人工作。
PDF
6 years ago
Prev
Next