Dec, 2023

基于强化学习的离散时间均值方差策略

TL;DR本文基于强化学习研究了一个基于离散时间的均值方差模型,与其在连续时间中的对应物相比,离散时间模型对资产收益分布作出了更一般的假设。使用熵来衡量探索成本,我们得出了最优投资策略,其密度函数也是高斯型的。另外,我们设计了相应的强化学习算法。模拟实验和实证分析表明,我们的离散时间模型在分析实际数据时比连续时间模型具有更好的适用性。