BriefGPT.xyz
Jun, 2024
基于强对偶性的分布鲁棒约束强化学习
Distributionally Robust Constrained Reinforcement Learning under Strong Duality
HTML
PDF
Zhengfei Zhang, Kishan Panaganti, Laixi Shi, Yanan Sui, Adam Wierman...
TL;DR
本研究通过基于强对偶性的算法框架,在环境不确定性的一个类别中提出了第一个高效且可证明的解决方法,来解决分布鲁棒受限强化学习(DRC-RL)问题,该问题旨在最大化预期奖励,同时受制于环境分布变化和约束条件。
Abstract
We study the problem of
distributionally robust constrained rl
(DRC-RL), where the goal is to maximize the expected reward subject to
environmental distribution shifts
and
→