委派分类
通过对去中心化机器学习生态系统的兴起的研究,我们研究了数据采集的委派。以契约理论为出发点,我们设计了能够处理两个基本机器学习挑战的最优和近似最优契约:模型质量评估的不确定性和关于任何模型最优性能的缺乏知识。我们展示了可以通过简单的线性契约解决不确定性问题,即使主体只有一个小的测试集合,也能达到第一优的收益的 1-1/e 的分数。此外,我们给出了主体测试集合大小的足够条件,以获得对最优效用的逼近。为了解决对最优性能缺乏先验知识的问题,我们提出了一个能够自适应高效计算最优契约的凸规划方法。
Sep, 2023
本研究通过实验研究 AI 算法在双重委托代理问题的双重合同模型中的行为,发现 AI 算法可以自主学会设计可以激励合规的合同,而在合同中,一方可以采取勾结或竞争等多态行为,而且欺骗行为似乎并不存在于制定的合同中。
Mar, 2023
通过合同设计解决在线学习问题中不同利益相关方的经济利益一致性,提出一种理论框架来解决机器学习中的代理问题,并设计了有效的动态规划算法和无悔学习算法以实现最优合同和平衡探索与开发的挑战。
Jul, 2024
机器学习中的好斗现象及其解决方案的研究,通过将分类问题建模为一种游戏的方式,提出了一种近乎最优的、能够抵抗 “好斗” 现象的分类器设计算法,尤其对于一类自然代价函数而言,该算法在计算上也是高效的。
Jun, 2015
在人工智能或自主智能体与人类组成的混合团队中,通过观察团队表现,我们的框架提供了一个经理模型,用于准确识别何时授权团队成员执行动作,而不限制代理机器人的环境模型,结果显示经理模型在不同环境表示下的代理团队中取得了显著的优势。
Sep, 2023
主要研究二进制状态的公共预测算法设计和决策委托规则优化,在代理与委托者之间存在信息不对称的情况下,发现委托决策只有在委托者观察到代理者的信息时会做出相同二进制决策时才是最优,提高算法预测的信息量并不一定是最优策略,相关算法限制和人机合作的共同偏好不一致会严重影响决策质量。
Feb, 2024
本文中,我们正式分析了代理人协作中的控制问题、合作问题、对齐问题和能力问题,以及这些问题对委托人利益的影响,并展示了如何通过有限观察来估计这些指标,并为设计更协调和合作的 AI 系统提供帮助。
Feb, 2024
研究探讨了自私学习代理和学习主体之间的重复逆向选择博弈,代理通过解决多臂赌博机问题来最大化其预期奖励和激励,主体则在保持一致性估计代理的未知奖励与通过提供自适应激励最大化自身效用之间进行权衡。
Aug, 2023