Jun, 2024

连续状态空间中的分布可靠随机控制的统计学习

TL;DR该研究论文介绍了一个分布鲁棒的随机控制范式,能够容纳对分布内可能的自适应敌对扰动的噪声进行考虑,在给定的模糊集合内。通过对两种敌对模型的研究,我们揭示了在不同的动态规划方程下的最优有限样本极小化率,以实现对连续状态下健壮价值函数的统一学习,考虑由 f_k - 散度和 Wasserstein 距离定义的模糊集合。最后,我们展示了我们的框架在各种真实世界环境中的适用性。