Apr, 2025

风险规避策略梯度的变异性度量

TL;DR本研究针对现有风险规避强化学习(RARL)文献中对变异性度量研究不足的问题,系统地分析了九种常见的变异性度量方法,并提出了针对未研究度量的策略梯度公式。研究发现,CVaR Deviation 和 Gini Deviation 在多种随机性及评估领域表现出一致的性能,为风险规避决策提供了重要的实用见解及未来研究的方向。