基于强化学习的双向交易与借贷优化投资组合

Aug, 2024

基于强化学习的双向交易与借贷优化投资组合

Optimizing Portfolio with Two-Sided Transactions and Lending: A Reinforcement Learning Framework

Ali Habibnia, Mahdi Soltanzadeh

TL;DR本研究针对高风险环境中的投资组合管理，提出了一种基于强化学习的模型，克服了传统模型的局限性。通过引入新的环境表述和基于盈亏的奖励函数，该方法提升了风险管理与资本优化能力，在市场波动较大的情况下显著提高了收益风险比，并实现了可观的盈利能力。

Abstract

This study presents a Reinforcement Learning (RL)-based Portfolio Management model tailored for high-risk environments, addressing the limitations of traditional RL models and exploiting market opportunities thro

发现论文，激发创造

利用深度强化学习进行加密货币投资组合管理

本文提出了一种使用历史价格数据的基于模型的卷积神经网络，输出给定金融资产的投资组合权重。通过强化学习的方式，对加密货币交易所0.7年的价格数据进行了训练，最终在30分钟内获得了10倍的回报，并将其与其他投资组合策略进行了比较。该模型不仅适用于加密货币市场，还可应用于任何其他金融市场。

Dec, 2016

金融组合管理问题的深度强化学习框架

本文提出了一个具有EIIE拓扑结构、PVM、OSBL方案和完全利用和显式奖励函数的基于深度强化学习的组合策略金融投资组合管理框架，该框架需要使用CNN、RNN或LSTM，通过在加密货币市场上进行三次回测实验，与其他相比，实现了最好的投资回报。

Jun, 2017

基于模型的深度强化学习在动态投资组合优化中的应用

使用深层强化学习的自主交易代理设计动态投资组合优化模型，通过模型无关机器学习模块、生成式对抗数据增强模块以及行为克隆模块实现训练，对历史金融市场数据进行模拟交易，证明该模型相较于先前的交易策略是稳健的、盈利的和风险敏感的。

Jan, 2019

基于加强学习的组合投资管理与增强资产动态预测状态

提出了一种基于强化学习的框架（SARL）来应对金融投资组合管理中数据异构性和环境不确定性的问题，实验结果表明，该框架可以提高投资组合的累积收益和风险调整后的利润。

Feb, 2020

使用深度强化学习进行加密货币市场交易的盈利策略设计

本研究使用深度强化学习算法——PPO、SAC、GAIL，针对三个加密货币市场的交易策略设计问题，通过价格数据和技术指标，实现了基于 Gym 仿真环境的交易策略，测试结果表明该方法有望帮助投资者在市场中获得更高的收益率，且最高收益率为 4850 美元。同时，我们还探讨了在环境设计中特定超参数的使用，可以用于调整所生成策略中的风险。

Jan, 2022

投资组合管理的利润、风险和可持续性平衡

本文提出了一种基于强化学习的投资组合优化系统，使用Sharpe比率和ESG评分作为效用函数，使用遗传算法进行参数优化，超越了现有的强化学习方法。

Jun, 2022

加密货币交易的深度强化学习：应对过度拟合回测的实用方法

该研究提出了一种用于处理加密货币交易中 backtest 过度拟合的实用方法，将检测 backtest 过度拟合看作一种假设检验，使用深度强化学习智能体来训练，估计过度拟合的概率并且拒绝过度拟合的智能体，最后，通过在包括市场崩溃的测试期间（2022年5月1日至2022年6月27日）对10种加密货币进行测试，该方法展现了比其他方法更好的市场表现和可行性。

Sep, 2022

风险感知的循环强化学习在配对交易中的应用

介绍了一种名为CREDIT的风险感知代理策略，能够像专业人士一样学习利用长期交易机会进行对冲交易。CREDIT是首个应用双向GRU和时态关注机制，以捕捉两种资产价格走势的长期模式来实现更高的利润的代理策略。实验表明，它在对冲交易中优于现有的强化学习方法，并在五年的美国股票数据中获得了显着的盈利。

Apr, 2023

将基于Transformer的深度强化学习与Black-Litterman模型相结合的投资组合优化

将深度强化学习代理与Black-Litterman模型相结合，能使代理学习到资产回报之间的动态相关性，并基于这种相关性实施高效的多头/空头策略。在由真实世界美国股票市场数据构建的投资组合上进行的实证结果表明，我们的深度强化学习代理在累积回报方面至少比各种对比投资组合策略和其他深度强化学习框架提高了42%。在单位风险回报方面，我们的深度强化学习代理在各种对比投资组合策略和其他机器学习框架基础上明显更优。

Feb, 2024

金融中的深度强化学习策略：资产持有、交易行为和购买多样性的洞察

通过分析交易行为，研究发现每个深度强化学习算法在金融应用中表现出独特的交易模式和策略，其中A2C是累计回报方面的最佳表现者。同时，PPO和SAC以有限的股票进行重要的交易，而DDPG和TD3采取了更加平衡的方法。此外，SAC和PPO往往持有较短时间的头寸，而DDPG、A2C和TD3则倾向于保持长时间不动。

Jun, 2024