Apr, 2023

强化学习中的观察器 - 反馈 - 前馈控制结构

TL;DR本文提出使用结构化神经网络进行基于强化学习的非线性自适应控制,聚焦于部分可观测系统和前馈结构,将观测器动态建模为循环神经网络,采用标准网络用于控制器。这种结构化方法在降低计算复杂性的同时,提供了可理解的控制结构,并在模拟中得到了显著的训练速度提升。