Oct, 2023

BayRnTune: 自适应贝叶斯领域随机化策略微调

TL;DR通过对先前学习的策略进行微调,我们提出了一种自适应贝叶斯域随机化策略,以显著加速学习过程,并在多个仿真环境中表现出与基准算法相比更好的奖励效果。