uncertainty-aware exploration | BriefGPT

关键词uncertainty-aware exploration

搜索结果 - 4

Diff-BBO：基于扩散的黑盒优化的逆向建模
基于扩散模型的逆向建模用于黑盒优化问题，通过设计新颖的获取函数（UaE），它利用条件扩散模型的不确定性在设计空间中生成样本，实现了在线黑盒优化，并在实验中证明了其优越性能。
PDF4 days ago
统一的不确定性感知探索：结合认知和随机不确定性
我们提出了一种基于分布式强化学习的算法，通过估计参数化回报分布来统一估计 aleatory 和 epistemic 不确定性，并量化两种不确定性的综合效应以实现风险敏感的勘探。实证结果表明，我们的方法在具有勘探和风险挑战的任务中优于替代方法
PDF6 months ago
基于混合模型的继承特征强化学习在任务间的不确定性迁移
使用混合模型驱动的继任特征算法和不确定性感知探索的方法，能够在具有不同转换动力学或 / 和奖励函数的任务之间实现高效的知识传输，并且在决策时间上所需的计算量较少。通过与最近的继任特征算法和模型驱动方法进行对比，结果表明我们的算法能够在不同的
PDF9 months ago
PPO-UE: 接近策略优化通过不确定性感知探索
该研究提出了一种名为 PPO-UE 的策略，它基于比率不确定性水平，优化探索过程，从而在 Roboschool 连续控制任务中显著优于基线 PPO。
PDF2 years ago