Feb, 2024

基于效用的强化学习:统一单目标与多目标强化学习

TL;DR通过引入基于效用的范式,将多目标强化学习的研究扩展到单目标强化学习领域,探讨了多策略学习、风险感知强化学习、折扣率以及安全强化学习等方面带来的潜在益处,并研究了采用基于效用的方法所带来的算法性能影响。