Nov, 2022

基于漏斗的信号时序逻辑强化学习

TL;DR本文介绍一种基于 funnel functions 的可行强化学习算法,用于实现连续状态空间中 STL 规范的鲁棒满足,并在摆和移动机器人示例上演示了该方法的实用性。