自适应算法和耦合协作
使用人工智能(AI)算法进行的算法性价格勾结引发了重大关切。我们研究了 AI 代理使用 Q-learning 在双边市场中如何进行默契勾结。我们的实验发现,与洛兰竞争相比,基于 AI 的平台实现了更高的勾结水平。增强网络外部性显著增强了勾结水平,这表明 AI 算法利用它们来最大化利润。用户异质性增加或外部选择带来的效用增加通常会减少勾结水平,而较高的贴现率会增加勾结。即使在低贴现率下,默契勾结仍然可行。为了减少勾结行为并提供潜在的监管措施,我们建议在 Q-learning 算法中加入惩罚项。
Jul, 2024
本研究探索人工智能定价算法在重复博弈中的表现,发现算法协作在人类行为偏好的影响下较为普遍,同时发现体验随机化、相对绩效影响和最新经验偏好都能增强算法协作,最后检测了不同因素下异质代理的表现和鲁棒性。
Feb, 2021
本文探讨算法定价在电子商务平台上产生的隐性勾结问题,并介绍了设计 ' 购买框 ' 规则来预防勾结定价的方法,同时提出了利用强化学习算法学习有效购买框规则的方法,并通过 Stackelberg POMDPs 方法,成功地制定出在不同销售行为模式和商品成本分布的情况下仍能提供高消费者福利的稳健规则。
Feb, 2022
我们模拟独立强化学习算法在 Crawford 和 Sobel (1982) 的战略信息传输游戏中的行为,显示出训练一起的发送方和接收方收敛到接近游戏先验最优均衡的策略,从而在代理之间的利益冲突程度给出的前提下,按照 Nash 均衡预测发生最大程度的通信。我们发现这个结论在超参数和游戏的替代规范下是稳健的。我们讨论了对信息传输游戏中均衡选择理论、计算机科学中算法间新兴通信的作用以及市场中由人工智能代理人组成的勾结经济的影响。
Oct, 2023
本研究旨在了解在没有特定假设的情况下,我们是否能可靠地学会与其他具有自适应行为的智能体合作,并得出一组不可能性结果,表明即使智能体保证与某些固定策略合作,也没有学习算法可以可靠地学习如何与所有可能的自适应伙伴合作;随后讨论了捕捉自适应伙伴只会理性地适应我们行为的潜在替代假设。
Jun, 2022
最近的学术研究广泛关注了由人工智能(AI)动态定价算法引发的算法勾结问题。然而,电子商务平台采用推荐算法来分配对不同产品的曝光,并且这个重要方面在以前的算法勾结研究中被大大忽视了。我们的研究弥补了文献中的这个重要空白,并且检查了推荐算法如何决定基于 AI 的定价算法的竞争或勾结动态。具体地,我们研究了两个常见的推荐算法:(i)一个旨在最大化卖家总利润的推荐系统(以利润为基础的推荐系统)和(ii)一个旨在最大化平台上销售产品的需求的推荐系统(以需求为基础的推荐系统)。我们构建了一个重复博弈框架,将卖家采用的定价算法和平台的推荐系统结合起来。随后,我们进行实验观察价格动态并确定最终的均衡。实验结果表明,基于利润的推荐系统增强了卖家之间的算法勾结,因为它与卖家的利润最大化目标相一致。相反,基于需求的推荐系统促进了卖家之间的价格竞争,并导致较低的价格,因为它与卖家的目标不一致。进一步的分析表明我们的发现在各种市场环境中的稳健性。总的来说,我们强调了平台推荐系统在定义数字市场竞争结构方面的重要性,为市场参与者和相关政策制定者提供了重要的见解。
Sep, 2023
本文通过运用机器学习算法与博弈论的框架, 利用多个均衡状态来调节和预测智能人和机器之间的协同适应交互, 并发现某些算法可有效地控制人的行为,从而引导人机交互达到机器的最优状态。
May, 2023
电子商务中基于人工智能的定价算法,特别是利用强化学习的算法,正变得越来越普遍。这项研究通过实验性寡头垄断模型的多次价格竞争,系统地改变环境以涵盖从基础经济理论到主观消费者需求偏好的各种情况,探究了代理人开发的策略和新兴定价模式,可能导致共谋结果。此外,我们还调查了代理无法观察到竞争对手价格的情景,并对所有情景进行了综合法律分析。我们的研究发现,基于强化学习的人工智能代理会趋于一种共谋的状态,其特点是收取超竞争价格,而无需进行代理间通信。实施其他强化学习算法,改变代理数量或模拟设置,以及限制代理的观察范围不会显著影响共谋市场的结果行为。
Jun, 2024
本文提出了一种新的框架,用于分析实际系统中分布转移的动态,该框架捕捉算法学习和它们所部署的分布之间的反馈循环,并针对两种常见的机器学习情景,通过偏微分方程模型证明了再训练过程的渐近收敛性,同时通过实证研究表明,该方法能够很好地捕捉自然数据中的分布变化。
Jul, 2023
本文提出了 Cooperative Open-ended LEarning (COLE) 框架,通过图形论的角度构建协作游戏的开放式目标,评估和确定每种策略的协作能力,进而解决合作不兼容的问题,并且实验证明该方法在与不同级别伙伴协调时优于现有的最先进方法。
Feb, 2023