BriefGPT.xyz
Ask
alpha
关键词
distributionally robust constrained rl
搜索结果 - 1
基于强对偶性的分布鲁棒约束强化学习
本研究通过基于强对偶性的算法框架,在环境不确定性的一个类别中提出了第一个高效且可证明的解决方法,来解决分布鲁棒受限强化学习(DRC-RL)问题,该问题旨在最大化预期奖励,同时受制于环境分布变化和约束条件。
PDF
18 days ago
Prev
Next