BriefGPT.xyz
Ask
alpha
关键词
discrete-time linear systems
搜索结果 - 1
一个 Q 学习算法用于具有随机未知分布参数的离散时间线性二次控制:收敛和稳定性
本文针对离散时间线性系统和二次标准的随机参数情况,提出一种基于 Q-learning 精神的在线迭代算法来求解这个无限时间视角下的最优控制问题。第一定理证明了学习序列的收敛性、控制问题的良态性和代数 Riccati 方程的解的可解性三个属性
→
PDF
4 years ago
Prev
Next