BriefGPT.xyz
大模型
Ask
alpha
关键词
uncertainty-aware exploration
搜索结果 - 4
Diff-BBO:基于扩散的黑盒优化的逆向建模
基于扩散模型的逆向建模用于黑盒优化问题,通过设计新颖的获取函数(UaE),它利用条件扩散模型的不确定性在设计空间中生成样本,实现了在线黑盒优化,并在实验中证明了其优越性能。
PDF
4 days ago
统一的不确定性感知探索:结合认知和随机不确定性
我们提出了一种基于分布式强化学习的算法,通过估计参数化回报分布来统一估计 aleatory 和 epistemic 不确定性,并量化两种不确定性的综合效应以实现风险敏感的勘探。实证结果表明,我们的方法在具有勘探和风险挑战的任务中优于替代方法
→
PDF
6 months ago
基于混合模型的继承特征强化学习在任务间的不确定性迁移
使用混合模型驱动的继任特征算法和不确定性感知探索的方法,能够在具有不同转换动力学或 / 和奖励函数的任务之间实现高效的知识传输,并且在决策时间上所需的计算量较少。通过与最近的继任特征算法和模型驱动方法进行对比,结果表明我们的算法能够在不同的
→
PDF
9 months ago
PPO-UE: 接近策略优化通过不确定性感知探索
该研究提出了一种名为 PPO-UE 的策略,它基于比率不确定性水平,优化探索过程,从而在 Roboschool 连续控制任务中显著优于基线 PPO。
PDF
2 years ago
Prev
Next