BriefGPT.xyz
Ask
alpha
关键词
distortion risk measures
搜索结果 - 1
面向分布式鲁棒安全强化学习的风险规避模型不确定性
我们提出了一个采用深度强化学习的框架,通过相干畸变风险度量考虑模型不确定性的风险规避观点,并表明我们的公式等价于具有性能和安全保障的分布鲁棒安全强化学习问题,并展示了我们框架在 Real-World 强化学习套件中各种具有安全约束的连续控制
→
PDF
a year ago
Prev
Next