BriefGPT.xyz
Ask
alpha
关键词
cost-efficient exploration
搜索结果 - 1
ICLR
基于贝叶斯优化的子目标探索
本文提出了一种基于代价感知的贝叶斯优化方法,旨在通过动态子目标的一系列探索策略来克服稀疏奖励、高昂交互和噪声等挑战,实现在未知分布环境下的政策学习。在实验评估中,平均而言,所提出的算法在问题领域上的表现优于 MAML 元学习算法 19%,超
→
PDF
5 years ago
Prev
Next