Apr, 2024

强化学习中的超参数优化的泛化基于人口的训练

TL;DR通过引入更灵活、更具体的超参数适应框架 Generalized Population-Based Training 和综合性的 Pairwise Learning 策略,我们的方法在自适应性和计算效率方面显著优于传统的 Population-Based Training,并且在一系列增强学习基准测试中持续优于传统的 PBT 和其贝叶斯优化变体。