深度强化学习在序列组合拍卖中的应用
本文研究了对手环境下的在线学习算法的设计,提出了广义随机扰动跟随者算法,且证明了在一定条件下它是牛逼优而且可以实现消失的后悔;同时,本文也提出了另一个基于拍卖设计的框架,用于帮助拍卖师在选举获得最佳的拍卖方式方面做出决策,并且得到相应的应用。
Nov, 2016
本研究提出了PreferenceNet,一种基于神经网络的拍卖机制,并利用人类提供的样本对所提出的机制进行了约束编码。同时,该研究引入了一种新的指标来评估拍卖分配的社会可取性,并通过人类主体研究验证了方法的有效性。
Jun, 2021
本文提出一种基于强化学习的方法用于解决组合优化中的数据标记和推理延迟问题,并使用蒙特卡罗树搜索和价值网络提高策略网络的性能表现。作者在四种不同类别的组合优化问题上进行了评估,结果表明该方法相较于现有机器学习和启发式方法有更优的性能表现。
Jun, 2022
论文研究强化学习及拍卖设计的优化决策算法,包括最大熵强化学习、基于贝叶斯角度的强化学习、策略学习算法 LEEP、匿名拍卖用于对称性保护的神经网络 EquivariantNet 及用于拍卖学习问题的双人博弈算法 ALGNet。
Oct, 2022
多智能体强化学习算法可用于理解迭代组合拍卖,但有效部署非平凡;作者描述了使得结果可行的建模决策以及如何克服MARL算法的挑战,并通过评估钟拍卖的特定规则改变展示了结果方法的潜力。
Feb, 2024
理解多单位拍卖中的竞标行为是研究者面临的持续挑战之一。本文利用人工智能,具体而言是强化学习作为一种无模型学习方法,来模拟三种常用多单位拍卖的竞标行为,讨论了六种适用于学习和竞标的算法,并通过一个示例进行比较。本文强调了在拍卖设计中使用人工智能的重要性,特别是在增强多单位拍卖的设计方面。
Apr, 2024
用可微经济学和深度学习实现自动机制设计,引入GEneral Menu-based NETwork (GemNet)来解决多竞标者、一般和全面策略性(SP)拍卖的学习问题,通过学习竞标者独立的菜单,使用Lipschitz平滑性确保菜单完整性,GemNet能够学习出收益更高、确切策略性的拍卖,并且具有较强的可解释性。
Jun, 2024