本研究探讨自动机制设计算法在组合拍卖中的应用,提供了关于组合拍卖类的样本复杂度分析,为自动机制设计奠定了坚实基础并推进了学习理论的边界。
Jun, 2016
本文主要研究如何通过改进膨胀熵函数的设计,加速第一阶段方法来解决 extensive-form games 问题,并提出了新的加权方案,实践证明本文方法比 CFR+算法更快。
Feb, 2017
这篇论文在研究房屋市场的资源分配问题,使用社交网络模型,探讨代理人之间的交易,提出了多项解决方案,其中包括了一种可在多项偏好下求解的多项式时间算法以及在路径网络中求解最优分配问题的复杂性分析。
Sep, 2019
本文介绍和研究了一种叫做全付出竞标游戏的二人零和博弈模型,在图形结构中进行,着重研究了投标策略和玩家预期收益,对于市场竞争等领域有借鉴意义。
Nov, 2019
该论文提出了一种新颖的方法利用线性规划解决计算均衡的问题,这种方法比以往的算法更高效,并可以用于解决大型的信息不完备博弈,特别是在极限状态下。
Jun, 2020
本文探讨了拍卖设计中激励兼容的问题,提出了使用神经网络和拉格朗日乘数法来实现优化拍卖的新思路,并将其形式化为双人博弈模型。
本文提出了一种基于投影梯度下降思想的具有公平性约束的上下文赌博问题解决算法,能够处理特定成本约束条件下的收益最大化问题。
May, 2023
本文研究了协同在线竞标算法在具有预算限制的重复次数第二价格拍卖中的效率,提出保证每个客户比独立竞标获得更高效用价值的算法,并以在线学习和均衡分析为技术支持,实现与多维基准的竞争。
Jun, 2023
在本文中,我们考虑了随机合作博弈的稳定分配学习问题,在这个问题中,奖励函数被描述为具有未知分布的随机变量。我们提出了一个名为“Common-Points-Picking”的算法,它在多项式数量的样本下,以很高的概率返回一个稳定的分配。我们的算法分析涉及了凸几何学中的一些新结果,包括多个凸集合分离超平面定理的扩展,可能具有独立的研究价值。
Feb, 2024
当两个玩家在具有未知收益矩阵的重复博弈中相互无意识地使用多臂赌博算法选择行动时,我们展示了当玩家使用汤普森抽样时,游戏动态收敛到纳什均衡的情况,尽管在这种情况下算法勾结不会发生,尽管玩家没有刻意采取竞争策略。为了证明收敛结果,我们发现随机逼近中开发的框架不适用,因为劣势行动的零星且不频繁的更新和缺乏Lipschitz连续性。我们开发了一种新颖的样本路径方法来展示收敛。
May, 2024