Jul, 2023

风险敏感强化学习是否得到适当解决?

TL;DR本论文研究风险敏感强化学习,在已有 RSRL 方法存在优化偏差的理论下,提出新的 Trajectory Q-Learning 算法,能够有效地实现不同风险度量的风险敏感策略。