学习代理的计量经济学

May, 2015

Econometrics for Learning Agents

Denis Nekipelov, Vasilis Syrgkanis, Eva Tardos

TL;DR本文开发了一种理论，可以在广义第二价格拍卖中从观察到的数据中推断出玩家估值，而不需要依赖于纳什均衡的假设，并展示了如何在一些 no-regret learning 算法的假设下推断玩家的价值，这对于在拍卖数据上测试任何学习理论行为模型前的重要步骤。

Abstract

The main goal of this paper is to develop a theory of inference of player valuations from observed data in the generalized second price auction without relying on the nash equilibrium assumption. Existing work in

inference player valuations nash equilibrium no-regret learning auction data

发现论文，激发创造

从行为理论到计量经济学：通过重复交互数据推断人类参与者的偏好

本文考虑了如何从人类交互数据中准确估计人类主体的偏好，并与行为经济学中的均衡概念相比较，其中四种基于行为均衡模型的估计方法被开发用于推断人类代理的效用，并使用 2x2 游戏的实验数据进行评估。结果表明，这些行为均衡方法产生的估计结果比纳什均衡法更准确，并且与量纲后悔法相比较，这些行为方法具有更好的命中率，但相对于整体均方误差来说，量纲后悔法表现更好，我们探讨了这些方法之间的差异。

Dec, 2021

遗憾最小化代理人之间的拍卖

本文研究一种情景，软件代理机器人实施后悔最小算法，代表他们的用户进行重复拍卖。研究一价和二价拍卖及其广义版本。使用理论分析和模拟，结果表明在二价拍卖中，玩家有激励向其自己的学习代理机器人提供不真实的估值，而在一价拍卖中，对于所有玩家真实报告其估值是一种占优策略。

Oct, 2021

重复拍卖中无悔竞标算法的收敛分析

本文研究拍卖中的无悔出价算法的收敛性，发现如果投标人使用任何基于均值的学习规则，则投标人定价会在第二价格拍卖中高概率收敛到单纯纳什均衡，在多个物品拍卖的 VCG 拍卖中以及在第一价格拍卖中收敛到贝叶斯纳什均衡，实验证实了这些理论发现。

Sep, 2020

不知道自己价值的情况下学习投标

在复杂拍卖场景中，我们提出了一种在线学习方法，通过利用投标方的效用结构和部分反馈，为拍卖算法提供对最佳固定竞标的遗憾率，这对于行动空间的依赖程度来说比应用通用的贝叶斯智能带宽算法要快指数级收敛，同时又几乎等同于在完全信息环境下所实现的收敛，这些结果是通过分析这一新的基于反馈的在线学习方法实现的。

Nov, 2017

经纪人的在线学习理论

在线学习视角下研究交易者间的经纪服务，在不同情况下，通过算法实现不同的后悔率和界定密度。

Oct, 2023

为了取得更好成绩而付费：学习智能体之间的游戏支付

在重复博弈中，我们研究了采用货币调节等教授动态学习策略的玩家对于行为激励的影响，包括其对学习动态、福利和分配的影响，并提出了一个简单的博弈论模型以解释这些情况。我们的研究表明，在一类广泛的博弈中，通过让学习代理在游戏动态过程中向其他玩家支付，玩家的福利得到提高，而在拍卖过程中，通过制定 “支付政策博弈” 的均衡，代理动态可以达到低收益的合谋结果，这为与机制设计相关的自动学习代理的系统提出了挑战。

May, 2024

如何向无悔购买者销售

本文提出了针对单个买方的拍卖问题，探讨了在买方使用 no-regret 学习算法的情况下，卖方进行售价策略和收益最大化的方法。作者通过详细的论证和实验对不同算法和竞标策略下的最优拍卖方式进行了完整的刻画和比较。

Nov, 2017

固定价格数据市场中的均衡与学习：外部性

该论文提出了一种模拟现实世界数据市场的模型，研究了买家之间存在的负向外部性问题，进而探讨了不同干预市场方式下的 Nash 均衡状态及社会福利最优的情况，并给出了一种适用于未知估值的在线学习算法。

Feb, 2023

基于遗憾的计量经济学的实验评估

该研究使用实验数据对 Nekipelov、Syrgkanis 和 Tardos（EC 2015）最近提出的基于遗憾的计量经济学方法进行了评估，发现尽管采用了较弱的遗憾假设，其结果至少与采用经典均衡假设获得的结果一样准确。其中，研究发现参与广告拍卖的高估价者理性地将遗憾降至最低，而低估价者的竞价则存在显著超额现象，作者建议进行修正这些偏差并调整基于遗憾的计量经济方法，以提高预测的准确性。

May, 2016

通过高斯过程在黑盒游戏中进行纳什均衡的无悔学习

这篇论文研究了学习在黑盒游戏中的挑战，其中底层效用函数对任何代理都是未知的。通过实证查询的形式，我们提供了一种利用高斯过程来识别这类游戏中平衡点的无悔学习算法。我们的方法不仅确保了理论上的收敛速率，还通过实验验证在各种游戏中的有效性。

May, 2024