Jul, 2023

连续时间强化学习:新设计算法的理论洞见和性能保证

TL;DR连续时间非线性最优控制问题中的强化学习方法面临复杂性、数值条件和维度扩展等挑战。该论文介绍了新的强化学习算法,应用于仿射非线性系统的控制,并引入了新的激发框架以优化性能。