Feb, 2023

元 - 强化学习任务的大规模参数化空间

TL;DR利用参数化空间随机生成简单元元强化学习任务,覆盖许多已知的任务,并能对二维拓扑任务进行扩展。作者描述了几个随机生成的元元强化学习任务,并讨论相关问题。