深度强化学习在序列组合拍卖中的应用

Jul, 2024

深度强化学习在序列组合拍卖中的应用

Deep Reinforcement Learning for Sequential Combinatorial Auctions

Sai Srivatsa Ravindranath, Zhe Feng, Di Wang, Manzil Zaheer, Aranyak Mehta...

TL;DR针对顺序组合拍卖的收益优化拍卖设计问题，本研究提出了一种新的强化学习框架，利用一阶梯度改进了传统的计算方法并在复杂实际拍卖场景中取得了显著的收益改善。

Abstract

revenue-optimal auction design is a challenging problem with significant theoretical and practical implications. sequential auction mechanisms, known for their simplicity and strong strategyproofness guarantees,

发现论文，激发创造

自动机制设计的样本复杂度

本研究探讨自动机制设计算法在组合拍卖中的应用，提供了关于组合拍卖类的样本复杂度分析，为自动机制设计奠定了坚实基础并推进了学习理论的边界。

Jun, 2016

高效在线学习和拍卖设计

本文研究了对手环境下的在线学习算法的设计，提出了广义随机扰动跟随者算法，且证明了在一定条件下它是牛逼优而且可以实现消失的后悔；同时，本文也提出了另一个基于拍卖设计的框架，用于帮助拍卖师在选举获得最佳的拍卖方式方面做出决策，并且得到相应的应用。

Nov, 2016

深度学习优化拍卖：可微分经济学的进展

使用深度学习工具，将拍卖建模为多层神经网络，将最优拍卖设计作为约束学习问题，并演示如何使用标准机器学习管道解决此问题。

Jun, 2017

拍卖学习作为双人博弈

本文探讨了拍卖设计中激励兼容的问题，提出了使用神经网络和拉格朗日乘数法来实现优化拍卖的新思路，并将其形式化为双人博弈模型。

Jun, 2020

PreferenceNet: 深度学习中将人类偏好编码于拍卖设计中

本研究提出了PreferenceNet，一种基于神经网络的拍卖机制，并利用人类提供的样本对所提出的机制进行了约束编码。同时，该研究引入了一种新的指标来评估拍卖分配的社会可取性，并通过人类主体研究验证了方法的有效性。

Jun, 2021

精确组合优化的深度强化学习：学习分支

本文提出一种基于强化学习的方法用于解决组合优化中的数据标记和推理延迟问题，并使用蒙特卡罗树搜索和价值网络提高策略网络的性能表现。作者在四种不同类别的组合优化问题上进行了评估，结果表明该方法相较于现有机器学习和启发式方法有更优的性能表现。

Jun, 2022

智能代理和机制学习算法

论文研究强化学习及拍卖设计的优化决策算法，包括最大熵强化学习、基于贝叶斯角度的强化学习、策略学习算法 LEEP、匿名拍卖用于对称性保护的神经网络 EquivariantNet 及用于拍卖学习问题的双人博弈算法 ALGNet。

Oct, 2022

通过多智能体强化学习来理解迭代组合拍卖设计

多智能体强化学习算法可用于理解迭代组合拍卖，但有效部署非平凡；作者描述了使得结果可行的建模决策以及如何克服MARL算法的挑战，并通过评估钟拍卖的特定规则改变展示了结果方法的潜力。

Feb, 2024

多单位拍卖设计的人工智能

理解多单位拍卖中的竞标行为是研究者面临的持续挑战之一。本文利用人工智能，具体而言是强化学习作为一种无模型学习方法，来模拟三种常用多单位拍卖的竞标行为，讨论了六种适用于学习和竞标的算法，并通过一个示例进行比较。本文强调了在拍卖设计中使用人工智能的重要性，特别是在增强多单位拍卖的设计方面。

Apr, 2024

菜单式、无策略性、多竞标人拍卖的GemNet: 基于深度学习的实现

用可微经济学和深度学习实现自动机制设计，引入GEneral Menu-based NETwork (GemNet)来解决多竞标者、一般和全面策略性（SP）拍卖的学习问题，通过学习竞标者独立的菜单，使用Lipschitz平滑性确保菜单完整性，GemNet能够学习出收益更高、确切策略性的拍卖，并且具有较强的可解释性。

Jun, 2024