BriefGPT.xyz
Ask
alpha
关键词
limited information
搜索结果 - 3
广义和谐史塔克伯格博弈中的去中心化在线学习
我们研究了分布式和策略性在线学习问题,通过对不完全信息和附加信息两种不同情境进行研究,发现追随者在有限信息情境中按照局部最优策略响应领导者的行动,然而在附加信息情境中,追随者可以通过策略性行动操控领导者的奖励信号,以使得领导者的策略收敛到对
→
PDF
2 months ago
主动第三人称模仿学习
通过选择适当的视角从有限的信息中获取专家行为进行第三方模仿学习,并使用生成对抗网络的主动学习方法来理论分析和实证研究其特性和对学习者性能的重要性。
PDF
6 months ago
通过模拟进行算法说服:生成式人工智能时代的信息设计
通过使用 oracle 查询来学习有关接收者的信仰,我们研究了信息设计与贝叶斯说服问题,设计了多项式时间查询算法来优化发送者的预期效用。
PDF
7 months ago
Prev
Next