Jun, 2024

金融中的深度强化学习策略:资产持有、交易行为和购买多样性的洞察

TL;DR通过分析交易行为,研究发现每个深度强化学习算法在金融应用中表现出独特的交易模式和策略,其中A2C是累计回报方面的最佳表现者。同时,PPO和SAC以有限的股票进行重要的交易,而DDPG和TD3采取了更加平衡的方法。此外,SAC和PPO往往持有较短时间的头寸,而DDPG、A2C和TD3则倾向于保持长时间不动。