基于缩放 Beta 策略的市场做市

Jul, 2022

Market Making with Scaled Beta Policies

Joseph Jerome, Gregory Palmer, Rahul Savani

TL;DR介绍了一种基于缩放贝塔分布的市场制造商行为新表示法，以及该方法在市场制造文献中的三个方法：单一价格层次选择、阶梯策略和即时市场制造等方面的泛化应用，研究发现该方法对自有资金管理非常有用，并通过高保真虚拟账本模拟器实验验证了该方法的优越性。

Abstract

This paper introduces a new representation for the actions of a market maker in an order-driven market. This representation uses scaled beta dist

market maker order-driven market scaled beta distributions inventory management limit order book

发现论文，激发创造

强化学习市场做市

本文提出了一种高保真度的极限订单簿交易市场模拟，并使用其设计了一个使用时序差分强化学习方法的市场制造代理，为此我们使用线性组合的 “瓷砖编码” 作为价值函数逼近器，并设计了一个自定义的奖励函数，控制库存风险。通过显示我们的代理优于简单基准策略和文献中的最新在线学习方法，我们展示了我们方法的有效性。

Apr, 2018

具有库存约束和定向投注的高频市场制造

在这篇论文中，我们将存货约束市场制作模型扩展到了相当一般的中间价格过程情况，针对指数或线性 PNL 效用函数，添加了一个存货风险规避参数，这个参数可以看作是市场制造者风险回报配置的微调。

Jun, 2012

学习型潜在 alpha 模型的交易算法

本文分析了如何通过学习潜在因素的后验分布来解决隐含最优交易问题，提出了一种 EM 算法的变体来校准模型，演示了此最优策略的性能和与忽略学习的策略的比较。

Jun, 2018

应对库存风险：市场做市问题的解决方案

本研究探讨了市场制造商在股票交易中所面临的复杂优化问题，通过建立随机控制问题的模型，研究了制造商的收益与风险的平衡，得到了一组线性常微分方程的解，并基于对最优行情的谱特性提出了一种简单的近似方法。

May, 2011

最优市场做市

本研究提出了一个通用建模框架，综合了文献中提出的各种建模方法，证明了最优市场制造策略的存在和特征，并针对多资产市场制造将模型框架扩展至通用的闭式近似方法。

May, 2016

微观极限订单簿模型下的算法交易

本文提出了一种微观结构建模框架来研究 FIFO（先进先出）限价委托簿中的最优市场制造策略，并使用 Cox 点过程模拟限价委托、市价委托和撤销委托的到达。应用马尔科夫决策过程和动态规划方法对期权交易问题的解决方案进行了分析，提出了最优策略。最后使用控制随机化方法和量化方法来计算最优策略，通过模拟数据进行的多个计算实验，证明方案的高效性。

May, 2017

使用深度强化学习从限价单簿中进行市场做市

本论文提出了一种基于强化学习的市场做市策略，使用卷积神经网络和注意力机制从限价单簿中提取特征，获得了良好的应用效果。

May, 2023

企业债市场做市的深度强化学习：打败维度诅咒

该研究提出了一种基于深度神经网络的模型的 Actor-Critic 算法，用于解决市场做市商在企业债券市场中的报价优化问题。

Oct, 2019

在线多尺度学习及其在网络拍卖中的应用

针对在线拍卖 / 定价问题的收益最大化问题，我们通过将专家学习和多臂赌博机问题推广到多尺度版本来推导出可缩放最佳固定价格而非价值范围的遗憾界，并且当与需要市场份额下限的基准进行比较时，可以获得几乎无尺度的遗憾界，同时满足离线样本复杂性。

May, 2017

风险厌恶强化学习的分布式方法

我们提出了一种分布式方法，用于在风险规避马尔可夫决策过程中学习最优策略，该方法使用嵌套 Kusuoka 类型条件风险映射构造的动态风险度量来评估策略表现，利用了对应动态规划原理中嵌入的某些结构，使用深度神经网络逼近值函数的条件分布，避免了探索阶段的维度灾难，并使用随机选择的一系列模型参数探索了该方法的性能。

Feb, 2023