本文提出了一种高保真度的极限订单簿交易市场模拟,并使用其设计了一个使用时序差分强化学习方法的市场制造代理,为此我们使用线性组合的 “瓷砖编码” 作为价值函数逼近器,并设计了一个自定义的奖励函数,控制库存风险。通过显示我们的代理优于简单基准策略和文献中的最新在线学习方法,我们展示了我们方法的有效性。
Apr, 2018
在这篇论文中,我们将存货约束市场制作模型扩展到了相当一般的中间价格过程情况,针对指数或线性 PNL 效用函数,添加了一个存货风险规避参数,这个参数可以看作是市场制造者风险回报配置的微调。
Jun, 2012
本文分析了如何通过学习潜在因素的后验分布来解决隐含最优交易问题,提出了一种 EM 算法的变体来校准模型,演示了此最优策略的性能和与忽略学习的策略的比较。
Jun, 2018
本研究探讨了市场制造商在股票交易中所面临的复杂优化问题,通过建立随机控制问题的模型,研究了制造商的收益与风险的平衡,得到了一组线性常微分方程的解,并基于对最优行情的谱特性提出了一种简单的近似方法。
May, 2011
本研究提出了一个通用建模框架,综合了文献中提出的各种建模方法,证明了最优市场制造策略的存在和特征,并针对多资产市场制造将模型框架扩展至通用的闭式近似方法。
May, 2016
本文提出了一种微观结构建模框架来研究 FIFO(先进先出)限价委托簿中的最优市场制造策略,并使用 Cox 点过程模拟限价委托、市价委托和撤销委托的到达。应用马尔科夫决策过程和动态规划方法对期权交易问题的解决方案进行了分析,提出了最优策略。最后使用控制随机化方法和量化方法来计算最优策略,通过模拟数据进行的多个计算实验,证明方案的高效性。
May, 2017
本论文提出了一种基于强化学习的市场做市策略,使用卷积神经网络和注意力机制从限价单簿中提取特征,获得了良好的应用效果。
May, 2023
该研究提出了一种基于深度神经网络的模型的 Actor-Critic 算法,用于解决市场做市商在企业债券市场中的报价优化问题。
Oct, 2019
针对在线拍卖 / 定价问题的收益最大化问题,我们通过将专家学习和多臂赌博机问题推广到多尺度版本来推导出可缩放最佳固定价格而非价值范围的遗憾界,并且当与需要市场份额下限的基准进行比较时,可以获得几乎无尺度的遗憾界,同时满足离线样本复杂性。
我们提出了一种分布式方法,用于在风险规避马尔可夫决策过程中学习最优策略,该方法使用嵌套 Kusuoka 类型条件风险映射构造的动态风险度量来评估策略表现,利用了对应动态规划原理中嵌入的某些结构,使用深度神经网络逼近值函数的条件分布,避免了探索阶段的维度灾难,并使用随机选择的一系列模型参数探索了该方法的性能。
Feb, 2023