BriefGPT.xyz
Jul, 2023
针对风险感知强化学习的分布式模型等价性
Distributional Model Equivalence for Risk-Sensitive Reinforcement Learning
HTML
PDF
Tyler Kastner, Murat A. Erdogdu, Amir-massoud Farahmand
TL;DR
本文研究的问题是如何学习用于风险敏感强化学习的模型。我们提出了通过分布强化学习引入两个新的模型等价概念,可以使我们规划任何风险度量的最优解,但我们还提出了一种实用可行的风险度量模型并展示了我们的框架可以用来增强任何模型无关的风险敏感算法。
Abstract
We consider the problem of learning models for
risk-sensitive reinforcement learning
. We theoretically demonstrate that proper
value equivalence
, a method of learning models which can be used to plan optimally in
→