Jun, 2023

商品市场中的深度政策梯度方法

TL;DR深度强化学习方法在商品交易中的有效性研究表明,在对2017年至2022年间的次月天然气期货进行回测时,该模型产生的夏普比率平均比买入并持有基准高83%,风险敏感度因子可用于调整风险承受能力。基于行动者的策略梯度算法明显优于基于演员-评论家的算法,基于卷积神经网络的模型略好于基于LSTM的模型。