Mar, 2024

分解控制李亚普诺夫函数以实现高效强化学习

TL;DR使用控制李雅普诺夫函数对强化学习进行奖励重塑并降低样本复杂性,通过分解控制李雅普诺夫函数计算提高了强化学习绩效,在多个示例中成功地在较少的真实数据量下降落四旋翼飞行器。