Jun, 2022

解决组合复杂度高的长视界深度强化学习任务的挑战

TL;DR通过提出一系列机器人任务,不需要额外的专业探索便可解决的优化问题,研究发现标准强化学习方法往往由于折扣而忽视长期影响,而通用层次强化学习方法则需要额外的抽象领域知识。