Dec, 2022

使用强化学习的基于STL的反馈控制器综合

TL;DR研究利用时序逻辑生成奖励对深度强化学习进行实时控制,并在多项复杂连续控制基准测试中证实了新模型相较于现有模型更为合适。