Oct, 2022

神经进化是技能发现中替代强化学习的竞争性方法

TL;DR通过在 8 种最先进的方法上进行广泛的实证评估,本文证明了 Quality Diversity (QD) 方法是技能发现的一种有竞争力的替代方案,既可以提供相同甚至更好的性能,而且对超参数更不敏感且可扩展性更高。