Feb, 2023

基于灵活约束的层次强化学习优化

TL;DR该论文主要研究通过约束条件解决具有复杂安全约束的长期决策问题,提出了一种结合高级有约束规划代理和低级目标条件强化学习代理的机制,能够处理成本分布的约束,并在实验中验证了其实用性。