Feb, 2021

论基于模型的强化学习中超参数优化的重要性

TL;DR本文研究了基于模型的强化学习中的自动超参数优化方法,实验证明,与人工调参相比,自动 HPO 能显著提高算法性能,并通过动态地调整多个超参数进一步优化模型性能,实验还揭示了计划视野和学习率等超参数对模型稳定性和奖励的影响。