学习代理的计量经济学
本文考虑了如何从人类交互数据中准确估计人类主体的偏好,并与行为经济学中的均衡概念相比较,其中四种基于行为均衡模型的估计方法被开发用于推断人类代理的效用,并使用 2x2 游戏的实验数据进行评估。结果表明,这些行为均衡方法产生的估计结果比纳什均衡法更准确,并且与量纲后悔法相比较,这些行为方法具有更好的命中率,但相对于整体均方误差来说,量纲后悔法表现更好,我们探讨了这些方法之间的差异。
Dec, 2021
本文研究一种情景,软件代理机器人实施后悔最小算法,代表他们的用户进行重复拍卖。研究一价和二价拍卖及其广义版本。使用理论分析和模拟,结果表明在二价拍卖中,玩家有激励向其自己的学习代理机器人提供不真实的估值,而在一价拍卖中,对于所有玩家真实报告其估值是一种占优策略。
Oct, 2021
本文研究拍卖中的无悔出价算法的收敛性,发现如果投标人使用任何基于均值的学习规则,则投标人定价会在第二价格拍卖中高概率收敛到单纯纳什均衡,在多个物品拍卖的 VCG 拍卖中以及在第一价格拍卖中收敛到贝叶斯纳什均衡,实验证实了这些理论发现。
Sep, 2020
在复杂拍卖场景中,我们提出了一种在线学习方法,通过利用投标方的效用结构和部分反馈,为拍卖算法提供对最佳固定竞标的遗憾率,这对于行动空间的依赖程度来说比应用通用的贝叶斯智能带宽算法要快指数级收敛,同时又几乎等同于在完全信息环境下所实现的收敛,这些结果是通过分析这一新的基于反馈的在线学习方法实现的。
Nov, 2017
在重复博弈中,我们研究了采用货币调节等教授动态学习策略的玩家对于行为激励的影响,包括其对学习动态、福利和分配的影响,并提出了一个简单的博弈论模型以解释这些情况。我们的研究表明,在一类广泛的博弈中,通过让学习代理在游戏动态过程中向其他玩家支付,玩家的福利得到提高,而在拍卖过程中,通过制定 “支付政策博弈” 的均衡,代理动态可以达到低收益的合谋结果,这为与机制设计相关的自动学习代理的系统提出了挑战。
May, 2024
本文提出了针对单个买方的拍卖问题,探讨了在买方使用 no-regret 学习算法的情况下,卖方进行售价策略和收益最大化的方法。作者通过详细的论证和实验对不同算法和竞标策略下的最优拍卖方式进行了完整的刻画和比较。
Nov, 2017
该论文提出了一种模拟现实世界数据市场的模型,研究了买家之间存在的负向外部性问题,进而探讨了不同干预市场方式下的 Nash 均衡状态及社会福利最优的情况,并给出了一种适用于未知估值的在线学习算法。
Feb, 2023
该研究使用实验数据对 Nekipelov、Syrgkanis 和 Tardos(EC 2015)最近提出的基于遗憾的计量经济学方法进行了评估,发现尽管采用了较弱的遗憾假设,其结果至少与采用经典均衡假设获得的结果一样准确。其中,研究发现参与广告拍卖的高估价者理性地将遗憾降至最低,而低估价者的竞价则存在显著超额现象,作者建议进行修正这些偏差并调整基于遗憾的计量经济方法,以提高预测的准确性。
May, 2016
这篇论文研究了学习在黑盒游戏中的挑战,其中底层效用函数对任何代理都是未知的。通过实证查询的形式,我们提供了一种利用高斯过程来识别这类游戏中平衡点的无悔学习算法。我们的方法不仅确保了理论上的收敛速率,还通过实验验证在各种游戏中的有效性。
May, 2024