Oct, 2023

重复委派选择的遗憾分析

TL;DR我们针对重复委托选择问题进行了研究,首次考虑了Kleinberg and Kleinberg, EC'18的在线学习变体。在这个模型中,一个负责人与一个拥有外生解集的代理人反复交互,以寻找有效的解。每个解对负责人和代理人都有不同的效用,并且代理人可能以一种自私的方式提出解,以最大化自己的效用。为了减轻这种行为,负责人宣布了一个合适的集合,筛选出一定的解集。然而,负责人事先对解集的分布没有任何信息。因此,负责人会动态地宣布各种合适的集合以有效地学习分布。负责人的目标是最小化与在事后的最优解集相比的累积后悔。我们探讨了问题设置的两个维度:代理人是否表现为短视行为或在多个轮次中进行策略化,并且解是否产生确定性或随机效用。我们的分析主要对一些情况进行了表征,从而揭示了重复委托过程在不同情况下的兴衰。