多发信者说服 —— 一个计算视角
本文从计算的角度出发,重点研究了李嘉图和根岑科夫在 Bayesian Persuasion Model 中提出的两个角色 —— 发送者和接收者,以及发送者如何通过优化任务最大化自己的收益。论文重点分析了三种自然输入模型下发情况的最优化问题,并针对每一种模型讨论了其计算复杂度。
Mar, 2015
我们模拟独立强化学习算法在 Crawford 和 Sobel (1982) 的战略信息传输游戏中的行为,显示出训练一起的发送方和接收方收敛到接近游戏先验最优均衡的策略,从而在代理之间的利益冲突程度给出的前提下,按照 Nash 均衡预测发生最大程度的通信。我们发现这个结论在超参数和游戏的替代规范下是稳健的。我们讨论了对信息传输游戏中均衡选择理论、计算机科学中算法间新兴通信的作用以及市场中由人工智能代理人组成的勾结经济的影响。
Oct, 2023
Bayesian persuasion and learning algorithms are used to address Markov persuasion processes where the sender has no prior knowledge, ensuring sublinear growth of regret in the number of episodes and matching the guarantees of the algorithm.
Feb, 2024
本文提出了一种新的序列信息设计模型 —— 马尔科夫说服过程(MPP),并在在线强化学习环境下设计了一种有效的无后悔策略学习算法(OP4),该算法可高效地确定具有有限或无限状态和结果的优化策略,提高发件人的效用。
Feb, 2022
本文介绍了使用自然语言评论的重复发送者(专家)- 接收者(决策者)游戏,利用 MCTS 算法和深度学习模型,以行为和语言信号为基础来预测下一个动作和未来的回报,进而形成口头说服。该专家相对于其他基准算法具有显著优势,并适用于不同的决策者。所选的评论适应于所提出的交易。
May, 2021
通过使用 oracle 查询来学习有关接收者的信仰,我们研究了信息设计与贝叶斯说服问题,设计了多项式时间查询算法来优化发送者的预期效用。
Nov, 2023
本文研究了有限本地信息条件下的分布式 Nash 平衡问题,通过重新制定多智能体协调问题,提出了一个修正版的渐进博弈动态,该动态使用局部估计和 Laplacian 反馈以实现同步收敛到 Nash 平衡。
May, 2017
我们引入了神经均衡求解器,它利用特殊的等变神经网络体系结构来近似解决具有固定形状、购买速度和决定性的所有游戏空间,并定义了一个灵活的均衡选择框架,该框架能够唯一选择最小化相对熵或最大化福利的均衡,该网络的训练无需生成任何监督训练数据,展示了在更大的游戏中惊人的零样本泛化能力。这样的网络是许多可能的多主体算法的强大组成部分。
Oct, 2022
研究内容为解决缺乏客观基本事实的情况下从多个代理人中收集信息的问题,介绍了一种有效的多任务机制和相关协议机制,并在不同信号分布条件下证明了其在保持强真实性方面的可行性。
Mar, 2016
提出了一种基于深度神经网络的算法来识别一般大型 $N$ 人随机微分博弈的马尔可夫纳什均衡,该算法的核心思想是将 $N$ 人游戏重塑为 $N$ 个解耦决策问题,并通过迭代解决。
Dec, 2019