- AAAI学习针对多个被有限理性代理人的一般和游戏
本文研究在多智能体博弈中,如何利用强化学习训练一个负责主导的智能体,并提出了能够在多项式时间内识别最坏情况响应的无懊悔动态方法,以提高该主导者策略的鲁棒性,且该方法可扩展为考虑有限理性的智能体。其应用之一为自动机制设计,本文实验结果展示了该 - ICLR诚实自博弈
提出了一种基于进化学习的框架,利用机制设计中的对等预测方法添加虚拟奖励,使多智体强化学习任务中的智能体能够达成合作,从而实现了无偏见状态表示的学习。在猎食者 - 被猎物,红绿灯和星际争霸等任务中,框架的表现达到了最先进水平。
- Soft-Max 函数的最优逼近 -- 平滑度折衷
本文提出了两种新的 soft-max 函数,其分别在近似和平滑度方面优于传统的 exponential mechanism 函数,并进一步探讨了 power mechanism 函数在差分隐私亚模性最优情况下的性能。
- 候选位置设施选址博弈机制设计
机制设计,通过策略证明机制来解决设施选址游戏,最小化代理的总成本和最大成本,并针对单设施问题和两设施问题分别证明了逼近度的下界和逼近算法。
- 公共项目资金筹措:纳什产品规则的案例
本文研究了一种机制设计问题,其中一群独立决策代理人希望通过社区成员自愿的货币捐助来为公共项目筹集资金,问题的目的是确定达成一个互利的个人贡献分配方案,文章提出了一种特定的机制,即纳什积分规则,它选择使代理人效用的乘积最大化的贡献分配方案,证 - IJCAI同儕提名:放寬精確度以提高同儕選擇的準確性
该论文介绍了一种新的算法 - PeerNomination,用于提高同行评议的公正性,避免个体代理的干扰,适用于资源分配、机制设计等领域,并在多个度量标准下在实证研究中取得更高的准确性。
- 多方机器学习的机制设计
该研究通过机制设计的方式探究了多方协作进行多方机器学习模型优化的问题,并提出了适用于这种情况的最优真实机制。
- 众包质量控制的统计建模和设计方法技术调研
本文介绍了众包质量控制中机制设计和统计模型两大分支的研究和应用,提出了系统化统一机制以确定响应质量的框架,并对质量控制论文进行了分类,并指出了当前的限制和未来的方向。
- SIGIR通过强化机制设计加速电子商务中的代谢过程
该研究通过建立产品生命周期模型,采用强化学习方法和机制设计框架来优化电商平台的印象分配策略,并在一家大型电商平台的模拟环境中进行了验证实验,证实了该策略在短期和长期回报上都有显著提升。
- 高维度策略无关的线性回归
本文研究机器学习和机制设计交叉领域,提出了一种策略性机制来解决线性回归中数据噪声与数据源的奖励的一致性问题,并且发现了一类广义抗干扰超平面机制,通过和 Ham Sandwich 定理的联合来证明了这些机制的博弈论属性和存在性。
- 基于神经网络的自动化机制设计
本文介绍的是一个名为 MenuNet 的神经网络框架,它可以自动化地设计出最优拍卖机制,且在实验中得到的机制都是 incentive-compatible 的,能够在多项收入最优设计中应用,并经过理论证明的机制是最优的。
- 多商品利润最大化的泛化保证:定价、拍卖和随机机制
本文探讨基于样本分布设计多项货品机制,利用分段线性结构证明了利润上限,并提出了优化复杂性和准确性之间的平衡的工具。
- 参与式预算问题的核心
本文重点研究的是公共物品在参与式预算中的分配问题,提出了一种使用博弈论中的核心概念来保障公平性的解决方案,该方案在计算上更易实现并且可以适用于广泛的效用函数,同时也解决了机制设计和激励问题。
- 使用随机化、分区和分摊的无欺诈对等选择策略
针对同行评议在科学、社会和商业领域的广泛应用,本研究提出了一种策略诚实、有效的同行选择机制,并通过模拟比较和随机取整技术解决了资源分配等相关问题。
- 公共项目,布尔函数和 Border 定理的边界
本文发现了一种复杂性理论的障碍,这表明 Border 定理不能显著扩展到最先进的情况,同时发现 Myerson 的最优拍卖理论在公共项目中的应用与布尔函数分析方面有着惊人的紧密联系。
- 具有战略数据来源的最佳统计估计
提出一种最优机制,为统计估算器的数据源提供货币激励,以低成本提供高质量的数据,使支付总额和估算误差最小,广泛应用于线性回归和多项式回归,核回归和岭回归等估算器,并应用于各种目标,包括在预算限制下减少估算误差。
- 多广告位赞助搜索竞拍的真实学习机制及外部性
该论文扩展了有关单 Slot 拍卖中的 sponsored search auctions 的机制设计的研究,并研究了使用级联模型来解决多 Slot 拍卖中的 CTR 估计和真实机制设计的问题。
- 区间投票的真实近似
研究机制设计的基本问题,即在无货币的情况下,考虑有限数量的备选方案和一般记数偏好下的近似社会福利最大化问题,并提出一种随机的期望真实序数机制来实现其预期社会福利至少是社会最优方案社会福利的 1/m^(3/4)。此外,对于足够多的代理和任何期 - 理解激励:机制设计转化为算法设计
本文提供了一种从机制设计到算法设计的计算高效的黑盒约简方法,并且在虚拟福利和收益两个问题上进行了探讨,发现在单调子模拟拍卖场景下,这两个问题都无法在多项式时间内进行近似解决。
- 实验设计的预算可行机制
本文研究预算机制,解决实验设计问题中的信息增益最大化问题,同时考虑受试者的成本和潜在威胁,并通过多项式时间的机制设计方案实现良好的近似效果。