Nov, 2020

深度可供性预见:通过未来可实现的行动计划

TL;DR本文提出了一种新的 affordance 表示,使机器人可以通过建模未来的 affordance 来推断长期效应,从而确定实现任务目标的最佳动作。通过该新表示,我们开发了一种 learning-to-plan 方法,Deep Affordance Foresight(DAF),通过试错学习参数化 motor skills 的 affordance 的环境模型,我们在两个挑战性的操作领域上评估了 DAF,并展示了它可以有效地学习执行多步任务,在不同的任务之间共享学习到的 affordance 表示,并学习用高维图像输入进行规划。