通过学习代理的重复合同,我们提供了一种动态合同的解决方案,这种合同对于知识有限的主体和代理都有利,并且可以应用于不同的时间范围。
Jan, 2024
研究主体 - 代理问题中的主体为了引导代理采取成本高且不可观察的行动以获得有利结果而承诺一种与结果相关的支付方案,考虑了与代理进行多轮合同承诺的问题的推广,设计了一种算法,在观察到每轮的结果后,能够以高概率学习到近似最优的合同,对于行动空间较小的情景,在最优合同学习方面取得了突破性进展,并在相关在线学习环境下用于最大化主体累积效用以提供近似为 O (T^4/5) 的遗憾上界,从而明显改善了之前已知的遗憾上界。
Sep, 2023
本文研究了基于隐藏行动模型的委托 - 代理问题,在其中委托人通过合同激励代理人参与项目。我们探讨了有界支付的合同是否可学习并近似最优。我们的主要结果是两个学习算法,可以在文献中的两个标准假设下通过多项式数量的查询找到近乎最优的有界合同。我们的多项式查询复杂性上界表明,标准假设足以在一般情况下实现对已知下界的指数改进。与现有算法不同,我们的算法直接学习基础的结果分布。关于有界合同的近似最优性,我们发现它们在乘法或加法逼近方面可能远非最优,但满足混合逼近的概念。
Feb, 2024
该论文主要研究了在线学习视角下的重复主体 - 代理问题,研究了当主体每轮与单个代理进行合同交互时的三种不同情境,并提出了不同的方法和技术来设计学习算法。此外,还研究了团队生产模型,并提出了一种有效找到最优合同的方法。
Mar, 2024
研究在线环境下的隐藏操作代理问题,介绍一种在线学习算法,提出一个关于 Stackelberg 遗憾的上界,并使用球形编码的覆盖数来限制契约设计的困难性和契约设计中的离散化误差,并提出解决方案,给出关于合同和行动空间的无限制上界。
Nov, 2022
这项研究探讨了多任务委托 - 代理问题,通过研究成本函数、边际效用和在线学习方法等,寻求了最优合约的解决方案。
May, 2024
提出了一种激励感知的机器学习任务委托理论框架来防止利益冲突及影响预测性能的问题,并通过学习曲线和标度律构建小规模数据所需的预算最优合约以实现性能和经济成果的综合评估。
Jun, 2023
本研究通过实验研究 AI 算法在双重委托代理问题的双重合同模型中的行为,发现 AI 算法可以自主学会设计可以激励合规的合同,而在合同中,一方可以采取勾结或竞争等多态行为,而且欺骗行为似乎并不存在于制定的合同中。
Mar, 2023
研究重复合同中的非响应均衡、赌博算法和有限责任合同的对策理论。
通过合同设计解决在线学习问题中不同利益相关方的经济利益一致性,提出一种理论框架来解决机器学习中的代理问题,并设计了有效的动态规划算法和无悔学习算法以实现最优合同和平衡探索与开发的挑战。
Jul, 2024