Nov, 2023

面向任务驱动的探索,加速具有时态逻辑任务规范的深度强化学习

TL;DR通过自动机表示 LTL 任务以及部分模拟未知系统动力学的神经网络,我们提出了一种新颖的深度强化学习(DRL)算法,其样本效率得以提高,能够更快速地学习控制策略,以在未知环境中的机器人导航任务中提高效率。