Feb, 2023

自我对战中的多样性诱导环境设计

TL;DR本文提出了一种多样性诱导的环境设计框架,将自适应课程学习与自我博弈相结合,以找到更加有效的不受监督的环境设计,取得了比现有方法更好的性能。