Jul, 2022

基于生成流模型的期望标量化收益多目标协调图

TL;DR本文介绍了一种名为 DMOVE 的算法,它利用连续回报分布来计算多目标协调图中预期标量化回报的集合。DMOVE 算法可用于风场控制等实际问题,可以计算期望标量化回报作为单次执行多策略时的实用功能。