BriefGPT.xyz
Ask
alpha
关键词
welfare maximization
搜索结果 - 3
多目标强化学习中的福利与公正
本研究探讨了如何在多个目标之间实现公平的多目标强化学习,其中一个代理必须学习一种同时在矢量价值回报的多个维度上获得高回报的策略。我们采用期望福利最大化方法,通过某些非线性公平福利函数对长期累积回报的矢量进行建模。我们提供了 Q-learni
→
PDF
2 years ago
多维机制优化设计:将收益降至最小以实现福利最大化
本文提供了一个从收入最大化到福利最大化的规约,以在具有任意(可能是组合)可行性约束和具有任意(可能是组合)需求约束的多维贝叶斯拍卖中,恰当地将 Myerson 的结果扩展到此设置。我们还展示了每个可行的贝叶斯拍卖都可以实现为虚拟 VCG 分
→
PDF
12 years ago
MM
限制补充物的组合拍卖
研究中提出了一种评估具有互补性的商品的模型,该模型的参数化方法取决于互补性的 “大小”,并为各种计算机查询、效用最大化算法和机制提供了一种选择。
PDF
12 years ago
Prev
Next