从数据中学习价值对齐机制的 HCMD-zero

Feb, 2022

从数据中学习价值对齐机制的 HCMD-zero

HCMD-zero: Learning Value Aligned Mechanisms from Data

Jan Balaguer, Raphael Koster, Ari Weinstein, Lucy Campbell-Gillingham, Christopher Summerfield...

TL;DRHCMD-zero 是一种学习性机制构建方法，通过与自身的复制品竞争来获取参与者的反馈，并在此基础上调整机制参数，从而实现更加被参与者青睐的目标，无需事先对参与者行为、可用知识、机制目的等进行强假设。研究发现，HCMD-zero 在资源分配于竞争等场景下，与强对比方法相比具有更好的表现和可解释性。

Abstract

artificial learning agents are mediating a larger and larger number of interactions among humans, firms, and organizations, and the intersection between mechanism design and machine learning has been heavily inve

artificial learning agents mechanism design hcmd-zero resource allocation game human participants

发现论文，激发创造

深度学习应用于机制设计：主要成果和一些新的应用

机制设计是通过深度学习逼近满足所需特性的机制，研究中介绍了技术细节和关键成果，并展示了三个实证案例。

Jan, 2024

人本机制设计与民主人工智能

通过 Democratic AI 方法，使用强化学习算法在参与者中探讨和设计社交机制来解决人工智能与人类价值观的对齐问题，有效缓解了财富分配不均，制止了搭便车行为并成功地赢得了大众的信任和认可。

Jan, 2022

善牧：用于机制设计的 Oracle 代理

本文提出了一个由两个嵌套学习环节构成的算法，通过与人工学习代理和人类合作来评估机制代理的表现，结果显示，该机制代理能够引导参与者策略朝着有利的结果发展，为现代机构有效而自动地影响其成员的策略和行为开辟了道路。

Feb, 2022

无限不完全信息游戏的受限自动机制设计

提出了一个基于两阶段博弈模型的自动化机制设计功能框架，并将其应用于几类不完全信息的两人无穷博弈中。我们的方法使用黑盒优化算法，可以实现优化或接近最优化的机制设计，并在多种应用领域得到了验证。通过与已知的最优机制进行比较，我们证明了该方法是参数化设计间接机制的一个有前途的方法。

Jun, 2012

多方机器学习的机制设计

该研究通过机制设计的方式探究了多方协作进行多方机器学习模型优化的问题，并提出了适用于这种情况的最优真实机制。

Jan, 2020

学习独立的因果机制

通过模拟物理机制，我们开发出一种无监督学习的算法，能够从变换后的数据点中恢复出一组相互独立的机制，并且这些机制可以移植到新的领域中，对于迁移学习有重要的启示和应用。

Dec, 2017

数据科学的机制设计

本文探讨如何根据参与者的历史数据来更新经济机制以优化其表现，着重研究了在保证推断参与者偏好可行的前提下，设计最优机制的理论。

Apr, 2014

基于神经网络的自动化机制设计

本文介绍的是一个名为 MenuNet 的神经网络框架，它可以自动化地设计出最优拍卖机制，且在实验中得到的机制都是 incentive-compatible 的，能够在多项收入最优设计中应用，并经过理论证明的机制是最优的。

May, 2018

一种简单的元学习范式，用混合注意机制进行零样本意图分类

本文提出了一种简单而有效的元学习范式，采用多种混合注意力机制来提取更好的话语特征，采用元学习策略来提高模型的泛化能力，从而在标准和广义零 - shot 意向分类任务上优于其他强基线

Jun, 2022

基于触觉的物体插入策略的零 - shot 转移

本文旨在训练一个模拟器中的接触利用操纵策略，以便在没有进行任何微调的情况下传输到实际机器人中，实验结果表明我们的策略比启发式和学习基线表现出更好的性能和泛化能力，同时也可以对不同尺寸和重量的盘子进行操纵，并探索了零点转移所需的各种因素。

Jan, 2023