BriefGPT.xyz
Dec, 2020
约束风险厌恶马尔可夫决策过程
Constrained Risk-Averse Markov Decision Processes
HTML
PDF
Mohamadreza Ahmadi, Ugo Rosolia, Michel D. Ingham, Richard M. Murray, Aaron D. Ames
TL;DR
该研究旨在设计面向具有动态一致风险目标和约束的马尔可夫决策过程的策略。作者提出了一个基于优化的方法来综合最小化受约束的风险-厌恶问题的可行马尔可夫策略,并通过数值实验验证了该方法的有效性。
Abstract
We consider the problem of designing policies for
markov decision processes
(MDPs) with dynamic coherent
risk objectives
and
constraints
.
→