May, 2024

Markowitz会见贝尔曼:知识蒸馏强化学习用于资产组合管理

TL;DR利用知识蒸馏进行训练的混合方法,将Markowitz的投资组合理论与强化学习相结合,通过两个训练阶段(监督学习和强化学习)来优化投资组合装配,结果表明我们的模型在回报和夏普比等指标方面表现出色,确保了在相似回报情况下的最高盈利和最低风险。