Jan, 2023

不确定系统最劣控制与学习的近似信息状态

TL;DR本文研究了在部分观测状态的不确定系统中的离散决策问题,并通过开发信息状态和近似信息状态的概念,提出了一个可行的决策框架。我们使用这一概念定义了近似动态规划,通过输出数据进行学习,以达到有界性能的策略,最后提供了数值实验来说明这一结果在控制和强化学习中的应用。