Dec, 2023

高效的离线安全强化学习:使用信任区域条件风险

TL;DR本论文提出了一种基于风险约束的安全强化学习方法,并通过引入适应性信任区约束以减少分布偏移的影响,解决了在复杂环境中实现优异性能并快速满足安全约束的问题。