利他博弈的鲁棒性劣解代价
本文开发了一个框架,为计算机科学应用中涉及到的包含多个参与者的博弈论模型提供了红利保障,以减小其混沌的程度,实现了对多个经典模型的实例化,包括 “同时出价单项竞拍”、“贪婪组合式拍卖” 和 “路由博弈”,并鉴定了在什么情况下多方博弈的 POA 更好,同时也给出了简单竞拍可以在现实中表现出几乎和最优竞拍一样的效果的新的方面。
Mar, 2015
该研究开发了工具,用于分析具有单维代理商的非对称拍卖中的 Bayes-Nash 平衡的福利和收益,分析分离了标准的平稳框架两个不同的部分,得到了关于社会福利和收益的无序价格结果,并为最优福利和最优收益提供了近似结果,同时还给出了同时组合多个拍卖的扩展定理。
Apr, 2014
本文提出了一种通用的、模块化的理论来证明竞拍中的平衡近似保证,该理论补充了传统经济技术,着重于精确和最优解决方案,并因此局限于相对简化的设置。我们提出了三个用户友好的分析工具:平滑型不等式、扩展定理和组合定理,将这些工具结合起来,为许多广泛使用的拍卖格式的均衡提供了严格的最坏情况近似保证。
Jul, 2016
该研究通过将驾驶游戏建模为拥塞游戏来界定均衡效率,并通过模拟交通拥堵情况对社会成本和个人利益之间的相对权衡进行探究,得出了针对一些问题的 PoA 的改进边界。该研究还通过去中心化多智能体强化学习策略得出了高效均衡状态。
Oct, 2022
通过分析几个主要城市的道路网络的旅行时间,我们评估了无协调驾驶者的乱象代价。我们的模拟表明,不协调的驾驶者可能会浪费相当数量的旅行时间。令人意外的是,简单地封锁某些道路可以部分改善交通状况。我们分析了各种复杂网络,讨论了物理学中类似的悖论可能性。
Dec, 2007
研究了利用自我私利游戏玩家的多臂赌博机问题,提出了一种能够实现对恶意玩家具有鲁棒性的算法,并构建了两个不同设置下的鲁棒算法,其中一种包括隐式通信的算法,同时针对只能观察奖励或手臂平均值任意变化的情况进行了研究。
Feb, 2020
探讨自动驾驶汽车的出现如何增加网络吞吐量,激励用户选择更优路径以便缓解拥堵,讨论自私均衡和互惠均衡之间的比较,并通过交通微观模拟实现了总延迟减少的目标。
Oct, 2018
研究如何学习最优税收设计以最大化无序拥堵博弈中的效率;通过均衡反馈方法来学习最优税收,通过分段线性税收来逼近最优税收,通过边界税收来找到最优解;算法的样本复杂度为 O (βF²/ε)。
Feb, 2024