BriefGPT.xyz
Ask
alpha
关键词
mixture of policies
搜索结果 - 1
神经进化是技能发现中替代强化学习的竞争性方法
通过在 8 种最先进的方法上进行广泛的实证评估,本文证明了 Quality Diversity (QD) 方法是技能发现的一种有竞争力的替代方案,既可以提供相同甚至更好的性能,而且对超参数更不敏感且可扩展性更高。
PDF
2 years ago
Prev
Next