BriefGPT.xyz
Ask
alpha
关键词
online tuning
搜索结果 - 2
学做还是边做边学:强化学习与贝叶斯优化的在线连续调节
使用反馈强化学习优化(RLO)和贝叶斯优化(BO)进行比较研究,在实际粒子加速器任务中,发现 RLO 通常表现更优,但并非在所有情况下都是最佳选择。基于研究结果,提供了一组明确的标准,以指导选择给定调谐任务的算法。
PDF
a year ago
AAAI
在计划空间规划中学习和调优元启发式算法
本文介绍了两种方法来改善 POCL 规划器的性能,包括使用有监督学习算法优化 POCL 规划器和使用在线误差最小化方法进一步提高模型的信息量。实验证明,这些学习方法可扩展规划器的性能,特别是在处理较大问题时更为有效。
PDF
8 years ago
Prev
Next