Oct, 2023

模型不确定性下分布安全强化学习:一种基于可微凸规划的单层方法

TL;DR通过使用可微的凸规划,本文提出了一种可追踪的分布安全强化学习框架,旨在解决安全关键环境中由于分布变动而产生的不确定性问题,在保证安全约束的同时有效地找到最坏情况下的不确定性,并通过测试验证了该方法在安全保证方面的显著改进。