Nov, 2022

华尔街树搜索:离线强化学习的风险感知规划

TL;DR本研究提出了一种将现代投资组合理论(MPT)与强化学习相结合、针对离线数据训练进行风险管理的算法,通过集成 MPT, 该算法能够更好地解决离线强化学习中存在的不确定性问题,并在使用 Transformer 结构的情况下达到最优解。