Jul, 2022
基于生成流模型的期望标量化收益多目标协调图
Multi-Objective Coordination Graphs for the Expected Scalarised Returns with Generative Flow Models
Conor F. Hayes, Timothy Verstraeten, Diederik M. Roijers, Enda Howley, Patrick Mannion
TL;DR本文介绍了一种名为 DMOVE 的算法,它利用连续回报分布来计算多目标协调图中预期标量化回报的集合。DMOVE 算法可用于风场控制等实际问题,可以计算期望标量化回报作为单次执行多策略时的实用功能。