BriefGPT.xyz
Ask
alpha
关键词
payoff
搜索结果 - 6
学习操纵承诺优化器
通过交互式查询领导者的最优承诺行为,研究表明,在缺乏信息优势的情况下,追随者可以在多项式时间内学习最优操纵方式。
PDF
a year ago
单位选择:从有限人口数据中学习受益函数
本论文提出了一种机器学习框架,利用可估算的有限人口数据上的福利函数范围来学习特征单元格的福利函数范围,以便轻松获得最大化福利函数的特征。
PDF
2 years ago
可数 MDP 中点收益、平均收益和总收益目标的策略复杂性
研究使用实值转移奖励的可数无限马尔可夫决策过程(MDPs),并针对不同奖励指标下的策略复杂性建立了完整的模型,确定了实现ɛ最优策略所需的最小记忆量。
PDF
2 years ago
具有相似性信息的情境赌博机
本文考虑相似度信息在上下文赌博中的应用,设计了基于自适应分区调整的更有效算法,用于在广告投放等领域中解决相应问题。
PDF
15 years ago
图上 Voronoi 游戏中的 Nash 平衡
在这篇论文中,我们研究了一种游戏,其中每个玩家需要在给定的无向图中选择一个顶点(设施)。然后,所有顶点(客户)都被分配给最近的设施,玩家的回报是分配给它的客户数量。我们证明了在给定图中决定 Nash 均衡的存在是 NP 难问题,这是我们所知
→
PDF
17 years ago
富豪游戏
本文研究了 Richman game 这种组合游戏中的最优策略,包括双方互相付款和与中立第三方付款的情况,考虑了双方知道对方有多少钱和不知道的情况。
PDF
29 years ago
Prev
Next