Oct, 2019

元世界:多任务和元强化学习的基准和评估

TL;DR本文提出了一个开源的模拟基准测试,包含 50 个不同的机器人操作任务,以评估 7 种最先进的元强化学习和多任务学习算法在这些任务上的表现,发现这些算法在解决多任务时仍存在挑战,为未来的研究提供了实验环境。