BriefGPT.xyz
Ask
alpha
关键词
offline hyperparameter selection
搜索结果 - 1
离线强化学习的超参数选择
本篇论文研究了针对离线数据选择最佳 RL 策略的离线超参数选择方法,并通过大规模实证研究表明:1)离线 RL 算法对超参数的选择不具有健壮性,2)离线 RL 算法和 Q 值估计方法等因素对超参数选择具有较大影响,3)通过控制这些因素,我们可
→
PDF
4 years ago
Prev
Next