代理市场订单的对比学习表示
我们提出了一个用于多智能体系统中建模代理行为的泛化学习框架,将代理建模作为表示学习问题,并使用模仿学习和代理识别的算法进行无监督学习,以构建代理策略的表示形式。在具有挑战性的高维连续控制和通信合作环境中,我们经验证明该框架对于使用深度强化学习进行无监督聚类和策略优化的监督预测任务具有实用价值。
Jun, 2018
我们提出了一种新颖的基于代理的方法来模拟仅通过市场制造商进行交易,并且代理的可见性受到网络拓扑结构的限制的场外金融市场。我们证明了网络拓扑结构与市场制造商的结合可以探索各种市场结构的作用,包括价格行为、市场的形成以及不同市场制造商之间的套利效应。
May, 2024
多代理系统中,对智能机器代理进行适应性策略设计时,代理建模是至关重要的,通过代理建模可以理解其他代理的行为并提取有意义的策略表示,为增强自我代理的适应性策略提供帮助。这篇研究以对比学习为基础的代理建模方法(CLAM)只依赖于自我代理在训练和执行过程中的局部观察,可以实时生成一致且高质量的策略表示,且在合作和竞争多代理环境中取得了最先进的结果,突显了对比学习为基础的代理建模在增强式学习中的潜力。
Dec, 2023
通过多智能体模拟方法探索复杂适应性金融交易环境是量化金融领域中创新的方法。我们设计了一种基于小规模元启发式方法的多智能体模拟方法,旨在代表澳大利亚政府债券交易的不透明双边市场,捕捉银行之间的双边交易特性,也称为 “场外交易”,通常发生在 “做市商” 之间。我们探讨市场刚性对市场结构的影响,并考虑市场设计中的稳定性因素,这扩展了对复杂金融交易环境的讨论,提供了对其动态和影响的更深入的理解。
May, 2024
在这篇论文中,我们介绍了一种多智能体强化学习方法来同时执行多个交易订单,并通过可学习的多轮通信协议改善合作效果。通过使用模型无关的强化学习方法,我们提供了一种解决交易执行问题的数据驱动方法。实验证明,我们的方法在两个真实市场的数据上表现出优越的性能和显著改善的合作效果。
Jul, 2023
本文提出一种新的预测市场模型,使用风险度量来建模市场中的代理人,并引入市场制造商来描述交易过程,分析表明,整个市场有效地达到了全局目标,同时建立了机器学习与市场之间的密切联系。
Mar, 2014
本文提出了一种全新的无监督学习框架来从单一的输入视频中学习适合于行动分割任务的动作表示,无需任何训练数据,达到了与现有无监督方法相比更高质量的时间边界恢复,并通过应用聚类算法在学习的表示上取得了具有竞争力的表现。
Apr, 2023
提出了一系列用于对付高波动性、高代价探索、多智能体交互等具有挑战性的贸易市场的强化学习算法,并将其应用于多智能体环境。这些算法不仅考虑风险意识、扰动下的鲁棒性和低学习方差,还进行了实证博弈理论的扩展。
Jul, 2021
本文提出了一种高保真度的极限订单簿交易市场模拟,并使用其设计了一个使用时序差分强化学习方法的市场制造代理,为此我们使用线性组合的 “瓷砖编码” 作为价值函数逼近器,并设计了一个自定义的奖励函数,控制库存风险。通过显示我们的代理优于简单基准策略和文献中的最新在线学习方法,我们展示了我们方法的有效性。
Apr, 2018
在双边撮合市场中,我们研究了竞争环境下在线学习的问题,如一方的代理人必须通过重复互动了解对另一方的企业的偏好,并与其他代理人竞争成功匹配。我们提出了一类分散、不需要协调的算法,代理人可以使用该算法在结构化匹配市场中达到稳定匹配,其决策仅基于代理人自己的游戏历史,不需要预先了解企业的偏好。研究表明,在代理人和企业的底层偏好具有现实结构假设的情况下,所提出的算法在时间范围内具有最多对数增加的后悔成本。在匹配市场的情况下,我们的结果表明,竞争不会极大地影响分散、不需要通信和协调的在线学习算法的性能。
Jun, 2022