May, 2019

从语义到执行:将动作规划与强化学习相结合,用于机器人因果问题解决

TL;DR本文介绍了一种基于奖励稀疏性的桥梁方法,将符号行动计划和强化学习相结合,以解决在噪声条件下涉及工具使用和复杂因果依赖的对象操作问题,并成功利用了数据和知识。