Dec, 2019

风险厌恶信任区域优化用于奖励波动率降低

TL;DR本文提出了一种新的风险评估指标 —— 奖励波动率,并建立了一个基于改进后的奖励波动率指标的策略梯度定理。通过在两个模拟的金融环境下进行测试,证明了该方法的有效性。