Jun, 2023

多元投资组合交易强化学习技术评估

TL;DR这项研究探讨了利用强化学习在S&P 500指数上进行交易的可行性,并采用了Value Iteration (VI)、State-action-reward-state-action (SARSA)的在线策略和Q-Learning的离线策略进行实验。该研究使用包含2000年至2023年多年的股市数据集进行训练和测试,并给出了包括COVID-19流行年份和排除COVID-19年份两种不同时间段的实验结果和发现。实验结果表明,在训练数据集中包含COVID-19时期的市场数据可以比基准策略获得更好的性能。在测试中,在线策略方法(VI和SARSA)胜过Q-Learning,突显了偏差-方差权衡和简单政策的泛化能力。然而,需要注意的是,Q-Learning的性能可能会因未来市场情况的稳定性而有所不同。未来的工作包括在测试和交易不同的个股时尝试更新的Q-Learning策略,并探索替代经济指标用于训练模型。