Jan, 2024

金融领域可扩展操作的 CNN-DRL

TL;DR基于 MLP 的 DRL 在金融领域中存在着在行动规模增加时难以学习环境动态的问题,为解决这一问题,我们设计了一个 CNN 代理,在连续 90 天的每日特征向量数据上进行拼接,形成 CNN 输入矩阵。通过大量实验证明,与 MLP 代理相比,我们设计的 CNN 代理在初始环境设置上经历了损失,但保持稳定,能够有效学习环境并带来奖励增加。